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文艺 复兴 以 来 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 
的 各 个 领域 取得 了 垄断 性 的 优势 ; 也 正 是 这 样 的 优势 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 
间 名 家 辈出 、 独 领 风骚 。 在 商业 化 的 进程 中 ， 美国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 
计算 机 学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科 学 著 
作 ， 不 仅 璧 划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 
其 价值 并 不 会 因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ， 我国 的 计算 机 产业 发 展 迅 猛 ， 对 专业 人 才 的 需求 
日 益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 
战略 上 显得 举足轻重 。 在 我 国信 息 技 术 发 展 时 间 较 短 的 现状 下 ,美国 等 发 达 国 家 在 其 计算 
机 科学 发 展 的 几 十 年 间 积淀 和 发 展 的 经 典 教 材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接 
轨 、 建 设 真正 的 世界 一 流 大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 公司 较 早 意识 到 “出 版 要 为 教育 服务 ”"。 自 1998 年 开始 ， 我 们 就 
将 工作 重点 放 在 了 六 选 、 移 译 国外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson、 
McGraw-Hill, Elsevier, MIT, John Wiley & Sons, Cengage 等 世界 著名 出 版 公司 建立 
了 和 良好 的 合作 关系 ， 从 它们 现 有 的 数 百 种 教材 中 甄选 出 Andrew S. Tanenbaum, Bjarne 
Stroustrup, Brian W. Kernighan, Dennis Ritchie, Jim Gray、Afred V. Aho, John E. 
Hopcroft, Jeffrey D. Ullman, Abraham Silberschatz, William Stallings, Donald E. 
Knuth, John L. Hennessy, Larry L. Peterson 等 大 师 名 家 的 一 批 经 暴 作 品 ， 以 “计算 机 
科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 究 及 珍藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 和 套 
丛书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 鼎力 相助 ， 国 内 的 专家 不 仅 提供 了 
中 肯 的 选 题 指 导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ;而 原 书 的 作者 也 相当 关注 其 作品 
在 中 国 的 传播 ， 有 的 还 专门 为 其 书 的 中 译本 作 序 。 迄 今 , “计算 机 科学 丛书 ”已 经 出 版 了 近 
500 个 品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书 
籍 。 其 影印 版 “经 典 原 版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ,这些 因素 使 我 们 
的 图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完 善 和 教材 改革 的 逐 
渐 深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 入 一 个 新 的 阶段 ， 我 们 的 目标 是 尽 
善 尽 美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公 司 欢迎 老师 和 读者 
对 我 们 的 工作 提出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 
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我 们 该 如 何 理解 人 的 决策 和 交互 ， 并 使 计算 机 程序 能 够 像 人 一 样 进行 决策 和 交 
E? 本 书 所 探讨 的 就 是 在 由 人 或 智能 体 所 组 成 的 系统 中 ,个 体 是 如 何 决 策 的 ; 以 及 这 
样 的 系统 该 如 何 理解 ， 如 何 设 计 。 

算法 博弈 论处 于 博弈 论 和 计算 机 的 交叉 领域 。 在 诸多 世界 顶尖 级 学 术 机 构 中 ， 均 
有 开设 此 门 课程 。 它 已 经 成 功 应 用 于 很 多 场景 ， 包 括 搜索 关键 字 竞 拍 、 在 线 广 告 、 机 
构 选 址 、 网 络 构建 、 频 谱 定 价 、 婚 恋 匹 配 、 无 人 机 群 、 竞 技 游戏 等 ， 其 中 有 些 已 经 收 
获 了 巨大 的 商业 效益 。 我 们 希望 此 次 翻译 能 够 让 更 多 的 人 了 解 并 喜欢 这 一 学 科 。 

原 书 是 基于 作者 Tim Roughgarden 多 年 的 授课 经 验 而 写成 的 。 如 果 能 跟随 作者 
的 思路 深入 研习 下 去 ， 定 会 受益 菲 浅 。 原 书 内 容 概 述 可 见 前 言 ， 此 处 不 再 闭 述 。 

本 书 的 翻译 是 我 在 讲授 研究 生 课程 “算法 博弈 论 ” 的 过 程 中 ， 与 我 的 学 生 李斌 和 刘 
凡 共同 完成 的 。 我 主要 负责 第 1 一 7、11 一 15 及 19 一 20 章 。 李 斌 主要 负责 第 8 一 10 及 
16~18 章 。 刘 凡 对 第 5 一 7 章 进行 了 协助 。 全 文 的 检查 和 修改 由 我 和 李斌 完成 。 我 们 
要 感谢 李 凯 、 董 涵 、 张 冬 呈 、 候 光 伟 、 石 琪 、 张 永亮 、 郭 宇航 进行 了 读 校 并 给 出 了 宝 
贵 的 修改 建议 。 感 谢 曲 烟 编 辑 的 邀请 和 机 械 工业 出 版 社 的 支持 。 

此 书 涉 及 博弈 论 、 理 论 计算 机 、 人 工 智 能 领域 的 诸多 知识 。 我 们 力求 翻译 可 靠 、 
易 读 ， 但 由 于 时 间 较 紧 ， 知 识 和 经 验 均 有 限 ， 译 文 难免 存在 不 足 ， 在 此 敬 请 各 位 学 者 
和 读者 朋友 批评 指正 ， 您 的 任何 意见 请 发 送 到 邮箱 haodongpost@ gmail. com, 
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在 过 去 的 15 年 里 ， 计 算 机 科学 和 经 济 学 进行 了 一 场 热烈 的 交互 ， 诞 生 了 一 个 叫 
作 “ 算 法 博弈 论 ” 或 者 “经 济 与 计算 科学 ”的 新 领域 。 计 算 机 科学 中 的 诸多 核心 问题 
本 质 上 都 涉及 多 个 自私 个 体 之 间 的 交互 ， 而 经 济 学 和 博弈 论 为 这 样 的 问题 提供 了 丰富 
的 推理 模型 和 定义 系统 。 在 传统 经 济 学 的 很 多 问题 上 ， 来自 计算 机 科学 的 研究 又 起 到 
了 补充 作用 。 例 如 ， 计 算 机 科学 聚焦 于 计算 复杂 性 ， 并 且 为 之 提供 了 整套 描述 语言 ; 
计算 机 科学 对 近似 边界 进行 了 研究 和 推广 ， 为 不 能 或 不 容易 找到 精确 解 的 问题 提供 了 
推理 方法 ; 计算 机 科学 还 为 贝 叶 斯 或 平均 情况 分 析 提 供 了 替代 方法 ， 而 这 能 帮助 经 济 
设计 间 题 找到 更 牢靠 的 解 。 

本 书 源 自我 在 斯 坦 福 大 学 所 讲授 的 “算法 博弈 论 ” 课 程 的 讲义 。 从 2004 年 到 
2013 年 ， 我 一 共 五 次 讲授 这 门 课程 。 该 课程 的 目标 是 利用 具有 代表 性 的 模型 和 结论 ， 
让 学 生 便 捷 、 容 易 地 进入 这 个 领域 。 本 书 的 目标 、 讲 授 结 构 和 关键 点 都 与 我 在 斯 坦 福 
大 学 的 课程 一 致 。 出 于 精简 内 容 的 需要 ， 本 书 没有 更 详细 地 展开 一 些 课题 ， 包 括 贝 叶 
斯 机 制 设计 、 紧 次 型 博弈 的 表示 、 计 算 社 会 选择 、 竞 赛 设计 、 合 作 博 弈 、 加 密 货 币 和 
网 络 系统 中 的 动机 、 市 场 均衡 、 预 测 市 场 、 隐 私 、 信 誉 系统 和 社会 计算 。 以 上 这 些 问 
题 很 多 都 可 以 参考 其 他 书目 ， 包 括 Brandt 等 (2016)、Hartline(2016)、Nisan 等 
(2007), Parkes 和 Seuken(2016)、Shoham 和 Leyton-Brown(2009)， 以 及 Vojnovic 
(2016), 

在 每 章 的 开头 ， 我 会 给 出 该 章 的 简要 介绍 。 在 本 书 的 最 后 ， 列 出 了 全 书 的 10 个 
主要 知识 点 。 除 此 以 外 ， 每 章 中 正文 结束 后 ， 都 会 将 重点 知识 总 结 出 来 。 除 了 作为 简 
介 的 第 1 章 以 外 ， 全 书 可 分 为 三 部 分 。 第 2 一 10 章 涵盖 关于 规则 制定 的 理论 ， 即 “机 
制 设 计 ”， 除 理论 介绍 外 ， 还 讲述 了 在 线 广告 、 无 线 频谱 拍卖 和 肾脏 交换 等 实际 问题 。 
第 11 一 15 章 介绍 的 是 “无 秩序 代价 ”理论 ， 这 是 关于 实际 博弈 中 均衡 的 近似 保证 的 ， 
例如 ， 由 自私 且 相 互 竞 争 的 个 体 组 成 的 大 型 网 络 就 是 这 样 一 个 博弈 。 第 16 一 20 章 介 
绍 的 是 关于 均衡 计算 的 一 些 结论 ， 既 包括 积极 的 结论 ， 也 包括 消极 的 结论 。 这 部 分 是 
基于 分 布 式 学 习 算 法 和 以 计算 效率 为 核心 的 算法 对 均衡 进行 分 析 和 计算 的 。 第 二 、 三 
部 分 可 以 独立 于 第 一 部 分 单独 学 习 。 学 习 本 书 第 三 部 分 需要 具备 第 13 章 的 基础 ; A 
外 ， 学 习 16.2 和 16. 3 节 需 要 12.4 节 的 基础 ， 学习 16.4 节 需 要 第 14 章 的 基础 。 标 
星 号 的 章节 包含 较 困 难 的 理论 和 技术 内 容 ， 可 以 选择 性 阅读 。 

本 书 假设 读者 有 一 定 的 数学 基础 ， 男 外 ,第 4、19、20 章 需 要 读者 对 多 项 式 时 间 
算法 和 NP 完全 性 有 基本 了 解 。 本 书 并 不 要 求 读者 具备 博弈 论 或 经 济 学 的 背景 ， 同 
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时 ， 本 书 也 不 能 代替 博弈 论 或 经 济 学 的 传统 教材 。 在 斯 坦 福 大 学 ， 上 这 门 课 的 学 生 包 
括 高 年 级 本 科 生 、 硕 士 生 和 一 年 级 博士 生 ， 他 们 来 自 不 同 的 专业 ， 包括 计算 机 科学 、 
经 济 学 、 电 子 工程 、 运 筹 党 和 数学 等 。 

在 每 一 章 的 正文 之 后 ， 我 都 简要 总 结 了 与 其 相关 的 参考 文献 。 课 后 练习 部 分 可 以 
作为 对 这 一 章 的 回顾 或 加 强 。 问 题 部 分 比较 困难 ， 但 能 带领 读者 一 步 步 走向 新 的 研究 
成 果 。 在 本 书 的 最 后 ,我 还 给 出 了 部 分 习题 的 提示 ， 有 提示 的 习题 都 带 有 “(H)” 
标记 。 

我 的 课堂 教学 视频 已 经 上 传 到 YouTube， 可 以 在 我 的 个 人 主页 (www. timroug- 
hgarden. org) 上 找到 链接 。 除 此 以 外 ， 还 有 其 他 几 门 理论 计算 机 科学 课程 的 讲义 和 视 
WM, 也 可 以 在 主页 上 找到 。 如 果 有 关于 本 书 内 容 的 问题 可 以 到 论坛 
(twentylecturesonagt. freeforums. net/) 与 我 及 其 他 读者 进行 讨论 。 

我 要 感谢 参加 我 的 课程 的 斯 坦 福 大 学 学 生 ， 他 们 提出 的 问题 和 建议 对 我 很 有 益 
处 。 感 谢 我 的 助教 Peerapong Dhangwatnotai, Kostas Kollias, Okke Schrijvers, 
Mukund Sundararajan 和 Sergei Vassilvitskii。 其 中 ，Kostas 和 Okke 帮助 我 准备 了 本 
书 中 的 部 分 图 示 。 感 谢 Yannai Gonczarowski、Warut Suksompong 和 Inbal Talgam- 
Cohen, 他 们 对 本 书 的 草稿 给 出 了 详细 的 反馈 。 感谢 Lauren Cowles, Michal Feld- 
man, Vasilis Gkatzelis、 Weiwei Jiang, Yishay Mansour, Michael Ostrovsky, Shay 
Palachy 和 Rakesh Vohra 给 出 的 诸多 建议 。 本 书 封面 是 由 Max Greenleaf Miller 设计 
的 。 本 书 的 撰写 得 到 了 美国 国家 科学 基金 会 CCF-1215965 和 CCF-1524062 项 目的 
资助 。 

如 果 你 有 任何 建议 或 发 现 了 书 中 的 朴 漏 之 处 ， 请 不 音 提出 ， 非 常 感谢 。 


Tim Roughgarden 
2016 年 6 月 
于 斯 坦 福 大 学 
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Twenty Lectures on Algorithmic Game Theory 


简介 和 实例 





本 书 由 三 部 分 组 成 ， 每 一 部 分 都 有 各 自 的 目标 。 第 2 一 10 章 探讨 如 何 设计 一 个 由 
多 个 策略 型 的 参与 者 组 成 的 系统 ， 并 保证 有 良好 的 性 能 表现 。 第 11 一 15 章 探 讨 在 什 
么 样 的 情况 下 自私 的 行为 是 良性 的 。 第 16 一 20 章 研 究 如 何 使 得 策略 型 的 参与 者 达到 
博弈 的 均衡 ， 以 及 如 果 达 到 了 ， 又 会 怎样 。 本 章 将 介绍 与 书 中 这 三 部 分 知识 相关 的 动 
机 和 实例 。 


1.1 关于 规则 制定 的 科学 


2012 年 奥运 会 在 伦敦 举办 。 在 羽毛 球赛 事 中 ,发 生 了 一 件 丑 闻 。 这 件 丑 闻 与 兴 
奋 剂 无 关 ， 而 是 由 于 赛制 设计 的 失败 导致 的 。 在 设计 赛制 时 ， 奥 委 会 没有 仔细 考虑 运 
动员 的 动机 这 一 关键 因素 。 

奥运 会 羽毛 球赛 制 的 设计 和 足球 世界 杯 的 赛制 类 似 。 一 共有 四 个 组 (A，B，C， 
D)， 每 组 中 有 四 支 参赛 队 。 赛 程 有 两 个 环节 。 第 一 个 环节 是 小 组 内 循环 赛 ， 每 一 支 
参赛 队 与 组 内 其 他 三 支 进行 比赛 ， 而 不 与 其 他 组 的 参赛 队 比 赛 。 小 组 赛 中 排名 前 两 位 
的 参赛 队 将 进入 第 二 个 环节 ， 排 名 后 两 位 的 参赛 队 则 直接 出 局 。 第 二 个 环节 采用 的 是 
淘汰 赛制 。 一 共有 四 场 四 分 之 一 决赛 ， 每 场 失败 的 参赛 队 被 直接 淘汰 ; 然后 是 两 场 半 
决赛 ， 半 决赛 中 失败 的 两 支 参赛 队 将 会 争夺 铜牌 ; 决赛 中 的 获胜 者 拿 金牌 ， 负 者 拿 
银牌 。 

在 这 样 的 过 程 中 ， 参 赛 队 、 奥 委 会 和 观众 各 自 的 动机 是 不 一 致 的 。 参 赛 队 想 要 的 
是 什么 ? 当然 是 拿 更 好 的 奖牌 。 奥 委 会 想 要 的 是 什么 ?好 像 他 们 并 没有 认真 思考 这 个 
问题 ， 但 是 在 丑闻 发 生 后 ， 我 们 很 清楚 奥 委 会 希望 每 支 参赛 队 都 能 尽 全 力 去 打 每 场 比 
赛 。 一 支 参 赛 队 竟然 会 想 要 输 掉 一 场 比赛 ” 在 淘汰 赛 环节 ， 因 为 输 一 场 会 导致 直接 被 
淘汰 ， 显 然 赢 绝对 是 比 输 要 好 的 。 

为 了 理解 动机 ， 我 们 需要 解释 小 组 赛 到 淘汰 赛 的 进 阶 过 程 ( 见 图 1. 1) 。 在 淘汰 赛 
的 四 分 之 一 决赛 时 ，A 组 中 积分 最 高 的 队伍 会 和 C 组 中 排名 第 二 的 队伍 比赛 ， 这 是 
第 一 场 四 分 之 一 决赛 。 类 似 的 ，C 组 中 排名 第 一 的 队伍 会 和 A 组 中 排名 第 二 的 队伍 
比赛 ， 这 是 第 三 场 四 分 之 一 决赛 。B 组 和 DD 组 中 前 两 位 的 队伍 会 以 类 似 的 方式 进行 匹 
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Al. PAB, OBAMAS RE. 问题 发 生 在 小 组 赛 的 最 后 一 天 ， 丹麦 队 的 Ped- 
ersen 和 Juhl(PJ) 对 阵 中 国 队 的 Tian 和 Zhao(TZ)，PJ 以 小 组 第 一 的 身份 晋级 淘汰 
R. MTZ 以 小 组 第 二 的 身份 晋级 。 





< TZ 
PJ vs. TZ . 
& 


PJ 


四 分 之 一 决赛 半 决 赛 决赛 胜 者 
图 1.1 2012 年 奥运 会 女子 羽毛 球 比 赛 中 ，WY BAA IK 队 都 想 尽 可 能 不 与 TZ 队 遭 遇 


第 一 场 有 争议 的 比赛 是 中 国 队 的 Wang 和 Yu(WY) 与 韩国 队 的 Jung 和 Kim(JK) 
的 比赛 。 这 两 个 参赛 队 的 战绩 都 是 组 内 胜 两 场 ， 所 以 两 队 都 能 提前 晋级 淘汰 赛 。 但 是 
有 一 个 问题 ， 本 场 比 赛 的 获胜 者 以 A 组 第 一 名 的 身份 晋级 后 ， 很 可 能 在 半 决 赛 时 迎 
战 上 面 提 到 的 TZ 队 ， 而 TZ 队 是 公认 的 强 队 。 如 果 输 给 TZ 队 ， 则 最 多 只 能 拿 到 铜 
牌 。 而 相 比 而 言 ， 本 场 比赛 的 失败 者 不 会 马上 迎战 TZ 队 ， 那 么 银牌 就 很 有 保障 了 。 
WY 队 和 JK 队 都 清楚 这 一 点 ， 所 以 比赛 时 两 队 都 想 输 给 对 方 ! 这 样 无 趣 的 比赛 导致 
WY 和 JK 两 队 最 终 被 取消 参赛 资格 。C 组 中 的 另外 两 个 参赛 队 也 因为 相似 的 原因 被 
取消 参赛 资格 。° 

问题 的 关键 在 于 ， 在 一 个 由 策略 型 参与 者 组 成 的 系统 中 ， 规 则 是 至 关 重要 的 ! 未 
经 精心 设计 的 系统 会 招致 意 想不到 的 结果 。 出 现 这 样 结果 的 责任 在 于 系统 的 设计 者 而 
不 是 参与 者 ， 设 计 者 应 该 预见 到 参与 者 的 策略 ， 而 不 能 要 求 参与 者 违背 自己 的 利益 行 
事 。 我 们 不 能 责怪 参赛 的 羽毛 球 队 ， 他 们 在 比赛 时 使 用 对 自己 有 利 的 策略 并 没有 错 。 

机 制 设计 是 一 门 成 熟 的 、 关 于 决策 的 科学 。 机 制 设 计 的 目标 是 设计 一 系列 规则 ， 
从 而 使 得 参与 者 的 策略 型 行为 能 够 导致 好 的 结果 。 本 书 中 所 涉及 的 机 制 设计 的 经 典 应 
用 包括 关键 字 搜索 拍卖 、 无 线 频 谱 拍卖 、 医 院 和 病人 的 匹配 以 及 肾脏 交换 等 问题 。 第 
2~10 章 涵盖 了 传统 经 济 学 中 关于 机 制 设 计 的 基础 知识 ， 以 及 计算 机 科学 对 于 机 制 设 
计 的 贡献 ， 包 括 计算 效率 、 近 似 优化 和 可 靠 性 保障 等 。 


日 ”在 这 届 奥 运 会 中 ，PJ 队 在 四 分 之 一 决赛 中 被 淘汰 ，TZ 队 最 终 获 得 金牌 。 
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1.2 自私 的 行为 在 什么 时 候 是 近似 最 优 的 


1.2.1 ARRE 


有 时 你 并 没有 条 件 从 零 开 始 来 构建 博弈 ， 而 是 要 先 根据 现实 状况 理解 博弈 。 考 虑 
图 1. 2 中 所 示 的 布雷 斯 悖 论 问题 。 有 一 个 源 节点 o， 一 个 目标 节点 4， 还 有 固定 数量 
的 司机 要 从 o 出 发 到 4 去 。 现 在 先 假设 o。 和 4d 之 间 有 两 条 不 相干 的 路 径 ， 每 条 路 径 都 
是 由 一 段 长 但 宽阔 的 路 和 一 段 短 但 狭窄 的 路 组 成 的 (图 1. 2a) 。 假 设 在 长 但 宽阔 的 路 
段 上 ,不 论 有 多 少 交通 流 ， 所 需 的 行程 时 间 都 是 1 小 时 ; 假设 在 短 但 狭窄 的 路 段 上 ， 
所 需要 的 时 间 等 于 其 上 所 承担 的 交通 流 的 百分比 。 图 1. 2a 中 边 上 的 数值 就 是 这 段 路 
程 所 需 的 时 间 。 每 一 条 路 径 上 的 总 体 时 间 代 价 是 1 十 +x， 其 中 xz 就 是 使 用 这 条 路 径 的 交 
通 流 的 比例 。 因 为 两 条 路 径 相互 独立 ， 交 通 流 会 在 这 两 条 路 径 上 均 分 。 这 样 ， 每 一 个 司机 
从 oo 出 发 到 达 d 所 花费 的 时 间 都 是 一 个 半 小 时 。 





a) 原始 网 络 b ) 变更 后 的 网 络 


图 1.2 布雷 斯 悖 论 。 每 一 条 边 上 都 标记 了 通过 该 边 时 所 花费 的 时 间 
函数 。 在 加 入 连 边 ("，z) 之 后 ， 无 秩序 代价 是 4/3 


假设 我 们 想 提 升 交 通 运行 能 力 ， 在 图 上 wv Aw 之 间 增 加 一 条 可 以 瞬时 通过 的 边 
(图 1. 2b)。 这 种 情况 下 ， 司 机 会 如 何 反 应 ? 之 前 的 交通 流 模式 将 会 被 打破 。 每 一 位 
司机 在 路 径 ov > wd 上 所 花费 的 时 间 都 不 会 比 原 先 两 条 路 径 上 的 时 间 更 多 ， 当 某 
些 司机 没有 使 用 这 条 新 的 路 径 时 ， 新 路 径 上 的 时 间 会 严格 小 于 原始 路 径 上 的 时 间 。 所 
以 ,我们 预期 所 有 司机 都 会 转变 到 使 用 这 条 新 的 路 径 。 因 为 边 (o,，v) 和 (w，d) 上 的 
拥堵 ， 现 在 每 一 位 司机 从 o 到 4 所 耗费 的 总 体 时 间 都 变 成 了 两 个 小 时 。 布 雷 斯 悖 论 告 
诉 我 们 ， 在 网 络 中 加 边 ， 虽 然 本 意 是 好 的 ， 但 有 可 能 导致 坏 的 结果 。 

布雷 斯 悖 论 还 展示 了 自私 的 路 由 不 能 将 司机 的 时 间 代 价 最 小 化 。 在 一 个 带 有 瞬时 
通路 的 网 络 中 ， 一 个 利他 的 指挥 者 能 使 每 一 个 人 的 时 间 代 价 降低 25%。 我 们 将 无 秩 
序 代价 (Price of Anarchy，POA) 定 义 为 策略 型 参与 者 自 组 织 情 况 下 系统 的 表现 与 系 


统 最 优 表现 的 比例 。 对 于 图 1. 2b 所 示 的 例子 ，POA 一 55 一 和。 





在 诸多 应 用 领域 中 ,包括 网 络 路 由 、 调 度 、 资 源 分 配 和 拍卖 ， 在 合理 的 条 件 下 ， 
POA 都 可 以 趋 近 于 1。 在 这 样 的 情况 下 ， 自 私 的 行为 会 导致 近似 最 优 的 结果 。 
1.2.2 线 与 弹簧 


布雷 斯 悖 论 不 仅仅 适用 于 交通 网 络 ， 它 还 能 与 机 械 网 络 “ 线 与 弹 自 ”对 应 起 来 。 
在 图 1. 3 所 示 的 设备 中 ， 一 只 弹簧 的 一 头 固定 在 项 上 ， 另 一 头 连 着 一 条 线 。 还 有 另 一 
只 相同 的 弹簧， 一 头 被 这 条 线 吊 着 ， 另 一 头 拉 着 一 个 重 物 。 上 面 这 只 弹簧 的 下 部 到 重 
物 连 有 一 条 松弛 的 线 ， 下 面 这 只 弹簧 的 上 部 到 项 连 有 一 条 松弛 的 线 。 


Jes 


10kg 








a) 剪断 前 b) 剪断 后 
图 1.3 线 与 弹簧 。 将 中 间 被 拉 紧 的 线 剪断 ， 将 会 使 重 物 被 提起 来 


如 果 合 理 选 择 弹簧 和 线 ， 这 个 机 械 网 络 可 以 达到 一 个 均衡 的 位 置 ， 如 图 1. 3a 所 
示 。 可 能 很 难 相信 的 是 ， 如 果 剪 掉 中 间 这 条 紧 的 线 ， 会 使 重 物 被 提起 来 ， 如 图 1. 3b 
所 示 。 这 个 现象 的 原因 是 一 开始 两 只 弹簧 是 串联 的 ， 所 以 每 一 只 都 承受 了 重 物 的 全 部 
重量 。 在 剪 掉 中 间 的 线 之 后 ， 弹 得 形成 了 并 联 ， 共 同 分 担 了 重量 ， 所 以 只 拉 伸 了 一 
半 。 在 这 个 例子 中 ， 重 物 位 置 的 提升 ， 和 交通 网 络 例子 中 瞬时 连 边 被 移 除 后 时 间 代 价 
的 减少 有 相同 的 效果 。 


1.3 策略 型 参与 者 能 通过 学 习 算 出 一 个 均衡 吗 


有 一 些 博弈 并 不 难 玩 。 例 如 ， 在 图 1. 2b 中 ,使 用 瞬时 连 边 是 不 需要 思考 的 ， 不 
论 其 他 司机 怎么 做 ， 每 个 人 都 会 选择 走 这 条 路 。 但 是 在 大 多 数 博弈 中 ， 一 个 参与 者 的 
最 优 动作 要 取决 于 其 他 参与 者 在 做 什么 。 下 面 所 示 的 石头 -剪刀 - 布 博弈 就 是 一 个 经 典 
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的 例子 。 




















两 个 参与 者 ， 其 中 一 人 选择 某 一 行 ， 另 一 人 选择 某 一 列 。 和 矩阵 每 一 个 格子 里 的 两 
个 数 分 别 代表 行 参 与 人 的 收益 和 列 参 与 人 的 收益 。 更 一 般 地 ， 一 个 双人 博弈 包含 每 个 
参与 者 的 有 限 策略 集合 ， 以 及 在 每 种 策略 组 合 下 各 方 所 获得 的 收益 。 

均衡 就 是 系统 的 稳定 状态 。 在 这 个 状态 下 ， 对 每 一 个 参与 者 来 说 ， 如 果 其 他 参与 
者 保持 不 变 ， 那 这 个 参与 者 也 会 想 保持 不 变 。 在 石头 -剪刀 - 布 博弈 中 ， 没 有 确定 性 的 
均衡 : 不 论 当前 的 状态 是 哪 种 ， 至 少 有 一 个 参与 者 可 以 通过 单方 面 改变 策略 来 获得 高 
收益 。 例 如 ， 博 弈 局 势 (石头 ， 布 ) 不 可 能 是 一 个 均衡 ， 因 为 行 参与 者 可 以 通过 单方 面 
改变 到 剪刀 来 获得 更 高 的 收益 。 

在 实际 玩 石头 -剪刀 - 布 时 ， 看 起 来 对 手 好 像 是 在 随机 选择 三 种 策略 。 这 样 一 个 在 
所 有 策略 上 的 概率 分 布 称 为 混合 策略 。 如 果 两 个 参与 者 都 平均 地 随机 选择 自己 的 三 种 
策略 ， 则 没有 任何 一 个 人 能 够 通过 单方 面 改变 策略 来 获得 更 高 的 收益 (任何 的 单方 面 
改变 策略 都 会 导致 期 望 收益 为 0)。 这 样 的 概率 分 布 所 形成 的 策略 对 就 叫 作 (混合 策 
略 ) 纳 什 均衡 。 

如 果 人 允许 随机 ， 那 么 每 一 个 博弈 都 至 少 含 有 一 个 纳什 均衡 。 

定理 1. 1( 纳 什 定理 ) 任何 一 个 有 限 的 双人 博弈 都 含有 纳什 均衡 。 

纳什 定理 在 任何 含有 有 限 人 数 的 博弈 中 都 成 立 ( 参 见 第 20 章 )。 

纳什 均衡 是 否 可 以 由 一 种 算法 或 者 一 个 策略 型 参与 者 自己 很 快 计算 出 来 呢 ? 在 石 
头 -剪刀 - 布 这 样 的 零 和 博弈 中 ， 纳 什 均衡 可 以 使 用 线性 规划 方法 很 快 计算 出 来 ; 或 者 
如 果 人 允许 很 小 的 错误 发 生 ， 也 可 以 通过 简单 的 迭代 学 习 算 法 计算 出 来 ( 见 第 18 章 )。 
这 些 算 法 的 结果 使 得 我 们 相信 纳什 均衡 对 于 零 和 博弈 有 很 好 的 预测 能 力 。 

但 是 在 非 零 和 双人 博弈 中 ,近期 的 研究 结果 表明 ， 并 不 存在 能 计算 纳什 均衡 的 快 
速算 法 ( 见 第 20 章 )。 有 趣 的 是 ，NP 困难 性 这 一 复杂 度 的 标准 好 像 并 不 适用 于 纳什 
均衡 的 计算 。 在 这 种 意义 上 讲 ， 计 算 双 人 博弈 的 纳什 均衡 是 一 个 少 有 的 、 自 然 的 且 展 
现 出 中 等 计算 困难 度 的 问题 。 

在 关于 均衡 概念 的 很 多 版 本 的 诠释 中 ， 牵 扯 到 某 些 智能 体 ( 参 与 者 或 者 博弈 设计 
者 ) 来 决定 一 个 均衡 。 如 果 所 有 的 参与 者 都 是 有 限 理性 的 ， 只 有 当 一 个 均衡 的 计算 代 
价 能 够 被 接受 的 时 候 ， 它 才 可 以 被 视 为 可 信 的 预测 。 所 以 ， 计 算 困 难 性 给 均衡 概念 的 
预测 能 力 提 出 了 质疑 。 在 计算 困难 性 之 前 ， 还 有 其 他 对 于 纳什 均衡 的 质疑 。 例 如 ， 博 
弈 可 以 含有 多 个 纳什 均衡 ， 而 这 种 非 唯 一 性 也 削弱 了 均衡 的 预测 能 力 。 即 便 如 此 ,来 


6 第 1 章 





自 计算 困难 性 的 批评 仍然 是 很 重要 的 ， 并 且 ， 这 是 使 用 计算 机 科学 中 的 概念 很 自然 地 
构建 出 来 的 。 计 算 困难 性 还 为 我 们 提供 了 动机 ， 使 得 我 们 去 研究 计算 可 行 的 均衡 概 
念 ， 例 如 相关 均衡 和 粗糙 相关 均衡 (第 13、17、18 章 )。 


总 结 


© 2012 年 奥运 会 的 女子 羽毛 球赛 丑闻 是 由 于 参赛 队 和 奥 组 委 的 目标 不 一 致 而 导 


致 的 。 
e 在 一 个 系统 中 ， 系 统 设 计 者 有 责任 预测 参与 者 的 策略 ， 而 不 应 该 指望 着 参与 
者 违背 自己 的 利益 行事 。 


© 布雷 斯 悖 论 告 诉 我 们 ， 在 网 络 中 修一 条 高 速 通道 有 可 能 会 给 交通 造成 负面 的 
影响 。 类 似 的 ， 在 线 和 弹簧 的 系统 中 剪 掉 一 条 线 可 能 会 使 得 重 物 的 位 置 上 升 。 

© 无 秩序 代价 (POA) 是 策略 型 参与 者 自 组织 情 况 下 系统 的 表现 与 系统 最 优 表现 

的 比值 。 当 POA 接近 1 时 ,说明 自私 的 行为 大 体 上 是 良性 的 。 

博弈 的 组 件 包括 : 一 个 参与 者 集合 ， 每 个 参与 者 有 一 个 策略 集合 ， 在 每 一 个 

博弈 局 势 下 ， 每 一 个 参与 者 都 有 一 个 收益 。 

e 在 纳什 均衡 下 ， 任 何 参 与 者 都 不 能 通过 单方 面 变 更 自己 的 策略 而 增加 收益 。 

纳什 定理 说 明 ， 每 个 有 限 博 弈 至 少 含有 一 个 混合 策略 纳什 均衡 。 

计算 双人 博弈 的 纳什 均衡 是 现实 世界 中 少 有 的 体现 出 中 等 计算 困难 的 实例 。 


说 明 


Hartline 和 Kleinberg(2012) 将 奥运 会 女子 羽毛 球赛 丑闻 和 机 制 设计 问题 联系 起 来 。 
布雷 斯 悖 论 来 自 于 Braess(1968) ， 线 和 弹簧 问题 可 以 参考 Cohen 和 Horowitz(1991) 。 关 
于 布雷 斯 悖 论 的 相关 引用 和 泛 化 参见 Roughgarden(2006) 。Koutsoupias 和 Papadimitrious 
定义 了 无 秩序 代价 。 定 理 1. 1 来 自 于 Nash(1950) 。“ 市 场 会 不 精确 地 为 一 个 重要 的 计算 
性 问题 找到 一 个 解 ”， 这 一 思想 可 以 追溯 到 亚当 。 斯 密 的 “看 不 见 的 手 ”(Smith， 
1776) 。Rabin(1957) 率 先 讨 论 了 有 限 理 性 和 某 些 均衡 概念 之 间 的 冲突 。 


练习 


练习 1. 1 为 奥运 会 羽毛 球赛 给 出 至 少 两 种 建议 ， 从 而 消除 参赛 队 故 意 输 掉 比 赛 的 动机 。 

练习 1.2 观赏 电影 《美丽 心灵 》 中 关于 纳什 均衡 的 片段 。 这 个 片段 是 四 个 参与 者 (四 
个 男人 )、 五 个 动作 (五 个 女人 ) 的 博弈 的 最 简单 建 模 。 解 释 为 什么 片 中 纳 
什 这 一 角色 提出 的 解决 方案 并 不 是 纳什 均衡 。 
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练习 1.3 


问题 


问题 1. 1 


问题 1. 2 


证 明 在 石头 -剪刀 - 布 博弈 中 ， 存 在 唯一 的 (混合 策略 ?纳什 均衡 。 


举 一 个 现实 世界 中 的 系统 的 例子 ， 在 这 个 系统 中 ， 参 与 者 的 目标 和 系统 设 

计 者 的 目标 基本 不 一 致 。 这 样 的 系统 可 以 是 一 个 网 站 、 一 场 比赛 等 。 为 解 

决 这 个 动机 问题 提出 一 种 方案 。 答 案 应 包括 : 

(a) 系统 描述 。 描 述 应 该 足够 细 化 ， 以 便 清 楚 表 述 动机 问题 以 及 你 对 该 问 
题 的 解 。 

(b) 给 出 一 个 参与 者 可 以 用 设计 者 不 希望 的 方式 在 这 个 系统 中 进行 决策 的 
例子 。 

Co) 为 什么 你 提出 的 方案 可 以 减少 或 者 消除 (b) 中 提 到 的 参与 者 策略 性 的 行 
为 ? 给 出 令 人 信服 的 论证 。 

参考 YouTube 上 关于 布雷 斯 悖 论 的 示例 ， 给 出 一 个 更 好 的 说 明 。 可 以 考 

虑 在 边 权 的 变化 幅度 等 方面 进行 扩展 。 


第 2 章 | 


Twenty Lectures on Algorithmic Game Theory 


机 制 设计 基础 





机 制 设 计 是 关于 规则 制定 的 科学 ， 本 章 我 们 将 开始 关于 机 制 设计 的 正规 学 习 。 我 
们 将 介绍 机 制 设计 中 的 一 个 重要 的 经 典 问题 一 一 单 物 品 拍卖 的 设计 ， 并 探讨 在 简单 情 
境 下 进行 机 制 设计 的 基础 知识 。 在 之 后 的 章节 中 ， 我 们 会 将 本 章 所 讲述 的 内 容 扩 展 到 
更 复杂 的 应 用 场景 中 。 

2. 1 节 定 义 单 物品 拍卖 ， 包 括 竞拍 者 的 拟 线性 效用 模型 。2. 2 节 将 密封 价格 拍卖 
进行 公式 化 表示 ，2. 3 节 涉 及 一 价 拍卖 ，2.4 节 介 绍 二 价 拍卖 ( 即 维 克 里 拍卖 ) 并 确立 
它 的 基本 特性 。2. 5 节 将 把 拍卖 设计 的 基本 目标 进行 公式 化 表示 ， 包 括 强 动机 保证 、 
高 性 能 保证 以 及 计算 高 效 。2. 6 节 列 举 一 个 拍卖 理论 的 关键 应 用 ， 即 为 在 线 广 告 而 设 
计 的 关键 字 搜 索 拍卖 。 


2.1 单 物品 拍卖 


我 们 从 单 物品 拍卖 开始 讨论 机 制 设 计 。 回 忆 我 们 本 部 分 的 总 体 学 习 目 标 。 

学 习 目 标 1 理解 如 何 设计 一 个 由 多 个 策略 型 参与 者 组 成 的 系统 ， 从 而 保证 这 个 
系统 有 良好 的 性 能 。 

考虑 卖家 想 要 卖 一 件 物品 ， 比 如 一 部 二 手 手 机 。 这 样 的 场景 是 易 贝 网 等 在 线 拍卖 
网 站 上 经 常见 到 的 。 假 设 有 个 策略 型 的 竞拍 者 都 想 要 买 这 个 物品 。 

我 们 想 要 做 的 是 ， 针 对 不 同 的 拍卖 模式 ， 对 竞拍 者 可 能 的 行为 进行 推理 。 为 
了 实现 这 一 点 ， 我 们 需要 为 竞拍 者 的 意愿 进行 建 模 。 第 一 个 关键 的 假设 是 : 每 一 
个 竞拍 者 对 于 物品 都 有 一 个 非 负 的 估 值 v;， 即 他 愿意 为 该 物品 支付 的 最 高 额度 。 
竞拍 者 i 希望 在 价格 最 高 不 超过 vi 这 一 前 提 之 下 ， 以 尽 可 能 便宜 的 价格 获得 该 物 
品 。 另 一 个 重要 的 假设 是 ， 这 个 估 值 是 私人 信息 ， 即 卖家 和 其 他 的 竞拍 者 并 不 知 
道 该 估 值 。 

竞拍 者 使 用 的 效用 模型 称 作 拟 线性 效用 模型 。 该 模型 的 描述 如 下 : 如 果 竞 拍 
者 i 在 拍卖 中 输 了 ,他 的 效用 是 0; 如 果 该 竞拍 者 以 价格 pms RHA. Mi 
他 的 效用 记 为 vi 一 p。 这 可 以 说 是 最 简单 且 符 合 现 实 的 效用 模型 ， 之 后 的 几 章 都 
将 使 用 这 个 模型 。 
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2.2 密封 价格 拍卖 


我 们 的 讲述 内 容 会 专注 于 一 类 简单 的 拍卖 形式 : 密封 价格 拍卖 。 具 体 如 下 : 





— 


. 每 个 竞拍 者 i 私下 将 他 的 报价 5; 提交 给 卖家 。 
2. 卖家 决定 谁 能 得 到 物品 (如 果 存 在 这 样 的 竞拍 者 )。 
3. 卖家 决定 卖 出 的 价格 。 





要 实现 以 上 第 二 步 ， 有 一 个 很 显然 的 方法 : 将 物品 分 给 最 高 报价 者 。 实 际 上 这 也 
是 本 书 中 所 使 用 的 唯一 的 选择 方法 .° 

要 实现 第 三 步 ， 有 多 种 合理 的 方法 。 不 同 的 实现 方法 将 对 竞拍 者 的 行为 有 显著 的 
影响 。 例 如 ， 假 设 卖 家 是 完全 利他 的 并 且 不 对 最 高 报价 者 收取 任何 费用 。 这 种 方法 会 
适得其反 ， 因 为 在 这 样 的 规则 下 ， 竞 拍 者 之 间 将 会 转向 另 一 种 博弈 ， 即 谁 给 出 的 数字 
最 大 ? 


2.3 一 价 拍卖 


在 一 价 拍卖 中 ， 获 胜 的 竞拍 者 需要 支付 的 价格 就 是 他 的 报价 。 这 种 拍卖 在 现实 中 


但 是 我 们 很 难 对 一 价 拍卖 进行 推理 。 首 先 ， 参 与 者 很 难 算出 究竟 该 如 何 报价 。 其 
次 ， 卖 家 或 拍卖 设计 者 很 难 预测 拍卖 中 将 发 生 什 么 。 假 想 你 参与 了 下 面 这 样 一 场 一 价 
拍卖 ， 你 对 在 售 物品 的 估 值 是 你 出 生日 期 中 的 月 份 与 日 期 的 和 ， 这 样 的 话 你 的 估 值 应 
该 位 于 2(1 月 1 日 ) 和 43(12 H 31 日 ) 之 间 。 假设 有 另外 一 个 竞拍 者 的 估 值 也 是 这 样 
定 出 来 的 。 这 种 情况 下 ， 你 如 果 想 最 大 化 自己 的 效用 ， 该 提交 什么 数字 作为 自己 的 报 
价 呢 ?如 果 你 知道 对 手 的 生日 ， 是 否 会 对 你 有 帮助 ? 如 果 你 知道 你 有 两 个 对 手 而 不 是 
一 个 ， 你 的 报价 是 否 会 改变 ?< 


2.4 二 价 拍卖 和 占 优 策略 


现在 我 们 专注 于 另外 一 种 同样 常见 的 单 物 品 拍卖 ， 这 种 拍卖 更 加 容易 进行 推理 。 
如 果 你 在 易 贝 网 上 赢得 了 一 场 拍卖 ， 你 需要 支付 多 少 ? 假设 你 的 报价 是 100 元 并 且 赢 


加 在 第 5、6 章 学 习 收益 最 大 化 问题 时 ， 我 们 将 会 看 到 为 什么 其 他 的 赢家 选择 方法 很 重要 。 
O ”关于 一 价 拍卖 的 更 多 理论 阐述 详 见 问 题 5. 3。 





了 ， 你 需要 支付 100 元 吗 ? 答案 是 不 需要 。 如 果 第 二 高 报价 是 90 元 ， 那 么 你 只 需要 
支付 90 元 就 可 以 了 ， 而 不 是 支付 自己 的 报价 100 元 。 也 就 是 说 ， 如 果 你 在 一 场 易 贝 
网 拍卖 中 获胜 了 ， 你 成 交 的 价格 是 所 有 人 报价 中 第 二 高 的 那个 价格 。 

二 价 拍卖 也 称 维 克 里 拍卖 ， 是 一 种 密封 的 拍卖 形式 。 在 二 价 拍卖 下 ， 最 高 报价 者 
赢 ， 并 且 其 支付 等 于 第 二 高 报价 。 为 了 阐述 二 价 拍卖 的 最 重要 性 质 ， 我 们 需要 给 出 一 
个 新 的 定义 一 一 占 优 策 略 ， 这 是 一 种 不 论 其 他 竞拍 者 如 何 报价 ， 都 能 使 本 竞拍 者 的 效 
用 最 大 化 的 策略 。 

命题 2. 1( 二 价 拍卖 中 的 动机 ) ”在 二 价 拍 卖 中 ， 每 一 个 竞拍 者 i 都 有 占 优 策略 ， 
即将 自己 的 报价 也 设 定 为 自己 的 真正 估 值 0;。 

命题 2. 1 意味 着 二 价 拍卖 很 容易 参与 。 当 竞拍 者 报价 时 ， 他 不 需要 推测 其 他 竞拍 
者 要 做 什么 ， 不 需要 关心 有 多 少 其 他 竞拍 者 ， 不 需要 考虑 其 他 竞拍 者 是 否 按照 自己 的 
估 值 如 实 报价 ， 等 等 。 这 和 一 价 拍卖 完全 不 同 。 一 价 拍卖 中 ， 按 照 自己 的 真实 估 值 报 
价 是 不 合 情 理 的 ， 因 为 这 只 能 保证 收益 为 0。 而 最 优 的 报价 取决 于 其 他 竞拍 者 的 
报价 。 

命题 2. 1 的 证 明 : 考虑 任意 一 个 竞拍 者 ;， 他 的 估 值 为 w， 其 他 竞拍 者 的 报价 组 
合 为 5,， 即 从 所 有 人 的 报价 组 合 5 中 移 除 竞 拍 者 i 的 报价 之 后 所 形成 的 向 量 。 我 们 
需要 证 明 竞拍 者 i 的 效用 在 b; 二 wv 时 最 大 。 

令 B=max bj 表示 除 i 以 外 的 最 高 报价 。 二 价 拍 卖 的 特殊 之 处 在 于 ,虽然 i 的 报 
价 有 无 穷 多 个 数字 可 以 选择 ， 但 这 些 报价 只 可 能 有 两 种 不 同 的 结果 产生 。 如 果 b 二 B， 
A i MPT HNL. BHO. WIG SB. Mi 赢得 这 场 拍卖 支付 的 价格 为 B, 
最 终 的 效用 为 .一 B。9 

最 后 ， 我 们 针对 i 的 估 值 分 情况 讨论 :一 种 情况 是 v 二 B， 这 种 情况 下 ，i 能 获得 
的 最 高 效用 是 max{0，v 一 B} 二 0， 当 如 实 报告 自己 的 估 值 时 ，i 将 输 掉 这 场 拍卖 并 
实现 效用 最 大 化 。 第 二 种 情况 是 w 达 B， 这 种 情况 下 ，; 能 获得 的 最 高 效用 是 max{0， 
vw 一 B} = 二 vw, 一 B， 当 如 实 报告 自己 的 估 值 时 ，i 将 赢得 这 场 拍卖 并 且 实现 效用 最 大 化 。 

a 

二 价 拍卖 的 另 一 个 重要 性 质 是 ， 说 真 话 的 买 家 ( 即 按照 自己 真实 估 值 报价 的 买 家 ) 
不 会 后 悔 参与 到 二 价 拍卖 中 来 。 

命题 2. 2( 非 负 效用 ) ”二 价 拍卖 能 保证 每 一 个 说 真 话 的 竞拍 者 的 效用 不 为 负 。 

证 明 , 二 价 拍卖 中 输家 的 效用 都 是 0。 如 果 赢 家 i 赢得 了 拍卖 ,他 的 效用 是 
wv 一 p， 其 中 p 的 值 就 是 第 二 高 报价 。 因 为 i 是 赢家 ， 所 以 他 必然 是 最 高 报价 者 ， 又 
因为 ; 是 说 真 话 的 ， 所 以 有 p<v,. Mo p>0. 


加 ”如果 有 两 个 相同 的 最 高 报价 ， 则 可 以 用 任意 的 方式 打破 候 局 ， 比 如 可 以 偏向 竞拍 者 i 不论 怎样 打破 
僵局 ， 命 题 2. 1 的 结论 都 不 受 影响 。 
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练习 2. 1 一 2. 5 探讨 了 二 价 拍卖 的 更 多 其 他 性 质 和 变种 。 例 如 ， 在 二 价 拍卖 中 ， 
真实 报价 是 唯一 的 占 优 策略 。 


2.5 理想 化 拍卖 


二 价 拍卖 是 理想 化 的 ， 因 为 它 具备 了 三 个 不 同 的 属性 ， 而 这 三 个 属性 都 是 我 们 想 
要 的 。 下 面 这 个 定义 描述 了 第 一 个 属性 。 

定义 2.3( 占 优 策略 激励 相 容 ) 在 一 场 拍 卖 中 ， 如 果 对 于 每 一 个 竞拍 者 按照 自己 
的 估 值 真实 报价 都 是 一 个 占 优 策略 ， 并 且 真 实 报价 的 竞拍 者 的 效用 都 非 负 ， 则 称 这 个 
拍卖 是 占 优 策略 激励 相 容 (Dominant-Strategy Incentive Compatible，DSIC) 的 。S 

单 物品 拍卖 结果 的 社会 福利 定义 为 


Siaa 
Hp, WRAHA i 赢得 了 拍卖 ， 则 二 为 1， 否 则 为 0。 因 为 只 有 一 个 物品 ， 所 以 有 一 


个 可 行 性 的 约束 条 件 5 z2 委 1 。 所 以 ， 社 会 福利 就 是 赢家 的 估 值 ， 或 者 如 果 没 有 赢 


家 的 话 ， 社 会 福利 就 是 0° 。 如 果 在 一 场 拍 卖 中 ,在 所 有 的 竞拍 者 都 说 真 话 的 情况 
下 ， 拍 卖 的 结果 能 导致 最 大 的 社会 福利 ， 就 说 这 场 拍 卖 是 社会 福利 最 大 化 (welfare 
maximizing) 的 。 下 一 个 定理 由 命题 2. 1、 命 题 2. 2 以 及 二 价 拍卖 的 定义 推出 。 

定理 2. 4( 二 价 拍卖 是 理想 化 的 ) 三 价 单 物品 拍卖 满足 以 下 几 条 性 质 : 

(1) [ 强 动机 保证 ] 二 价 拍卖 是 DSIC 的 。 

(2) [高 性 能 保证 ] 二 价 拍卖 是 社会 福利 最 大 化 的 。 

(3) [计算 高 效 ] 二 价 拍卖 可 以 在 输入 量 的 多 项 式 时 间 ( 实 际 上 是 线性 时 间 ) 内 实 
施 。 输 入 量 是 指 描述 v1 ，…，v, 所 需要 的 比特 的 数量 。 

这 三 条 性 质 都 很 重要 。 从 竞拍 者 的 角度 看 ，DSIC 性 质 使 得 报价 选择 变 得 非常 简 
单 易 行 。 从 卖家 或 机 制 设计 者 的 角度 看 ，DSIC 使 得 对 拍卖 结果 的 推测 变 得 更 容易 了 。 
需要 说 明 的 是 ， 对 于 一 个 拍卖 结果 的 任何 推理 ， 都 应 该 是 建立 在 竞拍 者 如 何 行动 这 一 
假设 之 上 的 。 在 DSIC 拍卖 下 ， 唯 一 的 假设 就 是 ， 如 果 一 个 买 家 有 明显 的 占 优 策略 ， 
他 就 一 定 会 选择 这 个 策略 。 这 一 行为 假设 并 不 算 强 。s 

如 果 你 能 够 保证 DSIC 性 质 ， 很 好 。 但 是 我 们 需要 更 多 。 例 如 ， 一 个 随机 免费 分 
发 物品 的 拍卖 是 DSIC 的 , 但 是 这 样 的 拍卖 并 没有 找 出 哪个 竞拍 者 最 需要 这 件 物品 。 


D 真实 报价 的 竞拍 者 的 效用 都 非 负 这 一 要 求 称 作 “ 个 体 理性 ”(Individual Rationality，IR)。 为 了 减少 
定义 书写 ， 本 书 中 将 这 一 点 加 入 DSIC 的 描述 中 了 。 

日 ”物品 的 售 价 并 没有 包括 在 社会 福利 的 计算 中 。 我 们 将 卖家 视 为 一 个 独立 的 智能 体 ， 他 的 收益 抵消 了 
赢家 由 于 支付 而 产生 的 收益 损失 。 

© 非 DSIC 的 机 制 也 很 重要 ， 更 详细 的 阐述 参见 4.3 节 。 
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社会 福利 最 大 化 这 个 性 质 很 奇妙 ， 即使 卖家 提前 不 知道 竞拍 者 的 估 值 ， 拍 卖 也 能 选 出 
最 高 估 值 的 竞拍 者 !〈 假 设 出 价 是 真实 的 ， 而 这 一 假设 可 以 被 DSIC 性 质保 障 ) 。 也 就 
是 说 ， 二 价 拍卖 解决 了 社会 福利 最 大 化 问题 ， 具 有 与 将 竞拍 者 的 私人 估 值 提前 公开 一 
样 的 效果 。 

计算 高 效 很 重要 ， 因 为 要 保证 潜在 的 实际 应 用 价值 ， 拍 卖 应 该 在 合理 的 时 间 内 运 
行 出 结果 。 例 如 ， 在 线 广告 拍卖 (如 2. 6 节 中 的 拍卖 ) 一 般 是 实时 地 给 出 结果 。 

2.6 节 和 第 3、4 章 都 是 依据 定理 2. 4， 这 些 章节 为 更 复杂 的 情境 寻找 理想 化 的 拍卖 。 


2.6 经 典 案例 : 关键 字 搜索 拍卖 


2.6.1 背景 知识 


在 搜索 引擎 的 搜索 结果 页 面 上 一 般 有 两 类 内 容 : 一 类 是 根据 PageRank 等 算法 得 
到 的 与 你 搜索 的 关键 字 有 直接 关联 的 源 生 链接 ， 另 一 类 是 广告 商 付 了 费 的 广告 链接 。 
每 次 你 在 搜索 引擎 上 搜索 一 个 关键 字 时 ， 搜 索引 擎 在 背后 都 实时 地 运行 了 一 场 拍卖 ， 
通过 这 场 拍卖 来 决定 哪些 广告 商 的 链接 能 够 被 显示 出 来 ， 这 些 链接 以 什么 次 序 排列 ， 
以 及 向 每 个 广告 商 收取 多 少 钱 。 这 样 的 关键 字 搜 索 拍 卖 创 造 了 巨大 的 网 络 经 济 效益 。 
相关 的 数据 非常 让 人 震撼 : 在 2006 年 ,来自 关键 字 搜索 拍卖 的 利润 占据 了 谷歌 总 利 
润 的 98%。 虽 然 在 线 广 告 现在 有 多 种 成 熟 的 表现 形式 ,但 是 关键 字 搜 索 拍卖 产生 的 
经 济 价值 仍然 是 每 年 数 百 亿 美元 量 级 的 。 


2.6.2 关键 字 搜索 拍卖 的 基本 模型 


下 面 我 们 针对 关键 字 搜 索 拍 卖 ， 讨 论 一 种 简单 、 实 用 且 很 有 影响 的 模型 。 需 要 销 
售 的 物品 是 某 个 搜索 结果 页 面 上 的 A 个 广告 链接 位 置 。 竞 拍 者 是 一 些 想 要 在 该 关键 字 
页 面 下 显示 自己 广告 链接 的 广告 商 。 例 如 ， 沃 尔 沃 和 斯 巴 鲁 可 以 是 “ 客 货 两 用 车 ”这 
个 关键 字 的 竞拍 者 ， 尼 康 和 佳能 可 以 是 “单反 相机 ”这 个 关键 字 的 竞拍 者 ， 这 样 的 拍 
卖 形 式 比 单 物品 拍卖 要 复杂 。 其 复杂 体现 在 两 个 方面 : 一 方面 ， 一 般 来 说 ， 有 多 个 物 
mF ESD; 另 一 方面 ， 这 些 物 品 是 不 同 的 。 例 如 ， 如 果 广 告 是 按 顺 序 显示 在 
页 面 上 的 ， 那 么 排 在 前 面 的 广告 比 排 在 后 面 的 广告 就 更 有 价值 ， 因 为 人 们 一 般 遵 循 从 
前 到 后 的 顺序 来 浏览 广告 列表 。 

我 们 使 用 点 击 率 (Click-Through Rate，CTR) 来 对 不 同 广告 位 之 间 的 差别 进行 量 
化 。 广 告 位 7 的 点 击 率 a; 表 示 的 是 用 户 点 击 这 个 广告 位 链接 的 概率 。 如 果 广 告 位 是 从 
上 到 下 排列 的 ， 那么 一 个 合理 的 假设 就 是 a Sa Sa. WT AAE, 我们 现在 
做 一 个 不 太 合理 的 假设 ， 即 广告 位 的 点 击 率 与 该 广告 位 的 内 容 无 关 。 关 键 字 搜 索 拍 卖 
可 以 扩展 到 更 一 般 化 且 符 合 实际 的 形式 ， 即 每 个 广告 商 i 都 有 一 个 自己 的 质量 分 8;( 越 
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高 越 好 ) ， 这 样 的 话 ， 广 告 商 ;在 广告 位 7 处 的 链接 的 点 击 率 计算 为 Bjaj( 见 练习 3. 4) 。 
我 们 假设 广告 商 并 不 在 乎 广告 的 曝光 量 ， 而 是 对 用 户 的 每 一 次 点 击 有 一 个 估 值 
vi。 这 样 的 话 ， 广 告 商 i 在 广告 位 7 处 的 期 望 值 就 是 via,。 


2.6.3 我 们 想 要 什么 


是 否 存在 理想 化 的 关键 字 搜 索 拍 卖 呢 ? 对 于 这 样 的 拍卖 ， 有 以 下 几 个 关键 的 需求 : 
(1) DSIC。 也 就 是 按照 真实 估 值 报价 是 占 优 策略 ， 而 且 效 用 不 会 为 负 。 


(2) 社会 福利 最 大 化 。 对 广告 位 的 分 配 应 该 使 得 3 vt; RAWE., KP ae Fe ot Bic 


给 i 的 广告 位 的 点 击 率 (如 果 该 广告 位 没 分 配给 任何 广告 商 ， 则 为 0) 。 每 个 广告 位 只 
能 分 配给 一 个 竞拍 者 ， 每 个 竞拍 者 只 能 得 到 一 个 广告 位 。 

(3) 计算 高 效 。 拍 卖 的 运行 时 间 应 该 是 输入 ( 即 癌 ，…， 忒 ) 的 多 项 式 级 的 (甚至 
是 近 线 性 的 ) 。 请 注意 ， 每 天 都 有 海量 的 这 种 拍卖 在 搜索 引擎 上 和 运行。 


2.6.4 我 们 的 设计 方法 


拍卖 问题 的 困难 在 于 ， 我 们 要 同时 处 理 两 个 搅 在 一 起 的 事情 : 决定 谁 赢得 拍卖 ， 以 
及 决定 每 个 人 付 多 少 钱 。 即 使 在 单 物品 拍卖 中 ， 如 果 只 做 对 了 第 一 件 事 (比如 把 物品 分 
给 出 价 最 高 的 竞拍 者 )， 也 是 不 够 的 。 因 为 如 果 没 有 好 好 设计 支付 ,那么 策略 型 参与 者 

令 人 高 兴 的 是 ， 在 许多 应 用 (包括 关键 字 搜 索 拍 卖 ) 中 ， 我 们 可 以 同时 解决 这 两 个 
交织 在 一 起 的 问题 。 





步骤 1: 假设 所 有 的 竞拍 者 都 如 实 报价 。 那 么 ,我 们 该 如 何 将 竞拍 者 分 配 到 广告 
位 上 去 ， 从 而 使 得 上 面 的 性 质 (2) 和 和 (3) 成 立 ? 

步骤 2: 在 得 到 步骤 1 的 解 之 后 ,我 们 该 如 何 设 定 售 价 ， 从 而 使 得 上 面 的 性 质 (1) 
成 立 ? 











如 果 能 高 效 地 解决 以 上 两 个 步骤， 那么 我 们 就 得 到 了 一 个 理想 的 拍卖 。 步 又 2 保 
证 了 DSIC 性 质 ， 这 意味 着 竞拍 者 会 如 实 报价 (前 提 是 如 果 竞 拍 者 有 占 优 策略 ， 就 会 
执行 这 个 策略 )。 这 样 的 话 ， 步 又 1 中 的 假设 就 得 到 满足 了 ， 所 以 拍卖 的 结果 就 是 社 
会 福利 最 大 化 的 。 

最 后 ， 我 们 来 看 看 在 关键 字 搜索 拍卖 这 个 情境 下 步骤 1 是 如 何 执行 的 。 如 果 报 价 
都 是 真实 的 ， 我 们 该 如 何 将 竞拍 者 分 配 到 广告 位 上 去 才能 实现 社会 福利 最 大 化 呢 ? 练 
习 2. 8 中 ， 要 求证 明 自 然 的 贪心 算法 是 能 实现 最 优 的 (而 且 是 计算 高 效 的 )， 即 对 于 所 
有 的 ;一 1，2，…，A&， 将 报价 第 :高 的 竞拍 者 分 配 到 点 击 率 第 ; 高 的 广告 位 上 去 。 





那 我 们 能 实现 步骤 2 吗 ? 是否 存在 和 二 价 拍卖 中 的 定价 相似 的 方案 ， 从 而 使 得 说 真 话 
是 一 个 占 优 策略 呢 ? 下 一 章 中 ， 我 们 将 基于 迈 尔 森 引 理 ， 对 此 问题 给 出 一 个 肯定 的 答案 。 


总 结 


e 在 单 物品 拍卖 中 ， 有 一 个 卖家 、 一 件 物品 、 多 个 竞拍 者 ， 每 个 竞拍 者 有 一 个 
私人 估 值 。 单 物品 拍卖 是 机 制 设 计 的 一 个 简单 但 经 典 的 实例 。 

o 在 一 场 拍 卖 中 ， 如 果真 实 报价 是 占 优 策 略 ， 并 且 真 实 报价 不 会 导致 效用 为 负 ， 

则 这 场 拍卖 是 DSIC 的 。 

在 一 场 拍卖 中 ， 假 设 报价 都 是 真实 的 ， 如 果 拍 卖 的 结果 永远 具有 最 大 的 可 行 

社会 福利 ， 则 这 场 拍 卖 是 社会 福利 最 大 化 的 。 

二 价 拍卖 是 理想 化 的 ， 因 为 它 是 DSIC 的 ， 是 社会 福利 最 大 化 的 ， 而 且 可 以 在 

多 项 式 时 间 内 运行 出 结果 。 

关键 字 搜 索 拍 卖 是 互联 网 经 济 的 重要 组 成 部 分 。 这 种 拍卖 比 单 物品 拍卖 要 复 

杂 ， 因 为 有 多 个 广告 位 待 售 ， 并 且 这 些 广告 位 的 质量 各 不 相同 。 

设计 理想 化 拍卖 的 一 般 化 方法 是 : 第 一 步 ， 假 设 报价 都 是 真实 的 ， 决 定 如 何 

分 配 物 品 以 实现 社会 福利 最 大 化 ; 第 二 步 ， 设 计价 格 ， 从 而 使 真实 报价 成 为 
占 优 策略 。 


说 明 


占 优 策略 激励 相 容 这 一 概念 参见 Hurwicz(1972)。 定 理 2.4 来 自 Vickrey(1961)， 
这 篇 论文 有 效 地 建立 了 拍卖 理论 这 一 领域 。2.6 节 中 关键 字 搜 索 拍卖 的 模型 参见 
Edelman 等 (2007) 和 Varian(2007) ， 前 者 包含 前 文 提 及 的 令 人 震撼 的 统计 数据 。 问 题 
2. 1 45 Dynkin(1963) 的 秘书 问题 有 较 强 的 联系 ， 也 可 以 参考 Hajiaghayi 等 (2004) 。 

2007 年 诺 贝尔 奖 委 员 会 给 出 了 一 个 历史 性 的 综述 ， 这 个 综述 对 20 世纪 七 八 十 年 
代 机 制 设计 理论 的 发 展 做 了 概述 。 当 代 的 情况 介绍 参见 Börgers(2015), Diamantaras 
等 (2009)， 以 及 Mas-Colell 等 (1995) 中 的 第 23 章 。Krishna(2010) 是 关于 拍卖 理论 的 
很 好 的 入 门 文献 。 


练习 


练习 2.1 考虑 一 个 至 少 有 三 个 竞拍 者 的 单 物品 拍卖 。 假 设 一 种 拍卖 机 制 将 物品 分 配 
给 最 高 报价 者 ， 收 取 的 费用 等 于 第 三 高 的 报价 ， 证 明 这 个 拍卖 机 制 不 是 
DSIC 的 。 


练习 2.2 


练习 2.3 


练习 2.4 


练习 2.5 


练习 2.6 


练习 2:7 


练习 2.8 
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证 明 在 二 价 拍卖 中 ， 对 于 一 个 竞拍 者 的 每 一 个 虚假 报价 5, 隆 v:， 都 存在 一 
个 其 他 所 有 竞拍 者 的 报价 组 合 b-;， 能 使 得 竞拍 者 i 在 报 5; 时 的 效用 严格 小 
于 其 在 报 w, 时 的 效用 。 

假设 有 个 相同 的 物品 以 及 ?之 & 个 竞拍 者 ， 每 个 竞拍 者 最 多 可 以 分 配 1 个 
物品 。 类 比 二 价 拍卖 构建 一 个 拍卖 机 制 。 证 明 你 的 机 制 是 DSIC 的 。 
考虑 卖家 卖 物品 时 ， 产 生 一 个 代价 c>0。 此 代价 可 能 是 由 于 卖家 对 物品 的 
估 值 为 c， 或 者 生产 该 物品 的 代价 为 <。 在 这 种 情况 下 ， 社 会 福利 的 定义 是 
赢家 对 物品 的 估 值 减 去 该 物品 对 于 卖家 的 代价 。 那 么 ， 该 如 何 修改 二 价 拍 
卖 来 使 得 机 制 仍然 满足 DSIC 及 社会 福利 最 大 化 ? 证 明 你 的 机 制 是 收 支 平 
衡 的 (budget-balanced) ， 也 就 是 说 ， 当 卖家 卖 出 物品 时 ， 他 的 收益 最 少 
是 c。 

假设 你 想 要 雇佣 一 个 承包 商 来 完成 某 个 任务 ， 比 如 装修 房子 。 每 个 承包 商 
都 有 执行 该 任务 的 成 本 ， 且 只 有 该 承包 商 自己 知道 该 先 验 知识 。 类 比 二 价 
拍卖 ， 给 出 一 个 机 制 。 该 机 制 使 得 承包 商都 能 汇报 自己 的 成 本 ， 并 选 出 一 
个 承包 商 ， 同 时 给 出 一 个 价格 。 在 这 个 机 制 中 ， 如 实 汇报 成 本 应 该 是 承包 
商 的 占 优 策略 ， 并 且 在 真实 的 成 本 报告 下 ， 你 的 机 制 应 该 能 选 出 成 本 最 低 
的 承包 商 。 胜 出 的 承包 商 收 到 的 价格 应 该 至 少 是 他 的 成 本 价 ， 落 败 的 承包 
商 不 应 该 支付 任何 费用 。 

[这 种 类 型 的 拍卖 叫 作 采购 拍卖 或 反 向 拍卖 。] 

将 易 贝 拍卖 和 密封 二 价 拍卖 做 个 对 比 。( 如 果 你 不 了 解 易 贝 拍卖 ， 先 去 研 
究 一 下 它 的 工作 模式 。) 你 在 这 两 种 拍卖 下 应 该 有 不 同 的 报价 吗 ? 请 解释 清 
楚 你 关于 竞拍 者 行为 的 假设 。 

你 可 能 在 电视 或 网 络 上 见 过 那 种 “要 价 - 举 牌 ”模式 的 公开 升 价 单 物品 拍 
卖 。 拍 卖 商 逐步 提出 更 高 的 要 价 。 这 样 的 拍卖 在 无 人 接受 当前 的 要 价 时 结 
束 ， 赢 家 就 是 接受 前 一 轮 要 价 的 竞拍 者 ， 并 且 成 交 价 就 是 前 一 轮 的 要 价 。 
请 将 这 种 公开 升 价 拍卖 与 密封 二 价 拍卖 做 比较 。 思 考 在 公开 升 价 拍卖 中 是 
否 存在 占 优 策略 。 

回忆 2.6 节 中 的 关键 字 搜 索 拍 卖 。 在 关键 字 搜 索 拍 卖 中 ， 竞 拍 者 i 对 每 次 
点 击 有 一 个 估 值 v;。 一 共有 个 广告 位 ， 其 点 击 率 分 别 是 a 之 a; 宇 … 之 ai。 


社会 福利 计算 为 Duc, ， 其 中 zz 是 分 配给 i 的 广告 位 的 点 击 率 (如 果 该 广 


告 位 没 分 给 任何 广告 商 ， 则 为 0) 。 对 于 所 有 的 ;一 1，2，…，A&， 将 出 价 第 
i 高 的 竞拍 者 分 配 到 点 击 率 第 i 高 的 广告 位 上 去 ， 证 明 这 种 分 配方 式 可 以 
使 得 社会 福利 最 大 化 。 
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问题 
问题 2.1 本 问题 针对 的 是 在 线 单 物品 拍卖 ， 其 中 竞拍 者 一 个 接 一 个 到 来 。 假 设 部 拍 


者 数量 已 知 ， 竞拍 者 i 的 私人 估 值 是 c。 我 们 考虑 如 下 模式 的 拍卖 。 





在 线 单 物品 拍卖 
对 于 到 来 的 每 个 竞拍 者 11，2，…，7: 
如 果 物 品 在 前 一 迭代 阶段 没有 售 出 ， 制 定 一 个 非 负 价 格 p;， 
然后 接收 来 自 竞 拍 者 i 的 一 个 报价 0;; 
如 果 p; 三 5b:， 则 将 物品 以 价格 pi; 卖 给 竞拍 者 i; 
否则 ， 竞 拍 者 i 离开 且 物 品 依 旧 待 售 。 











(a) 证 明 这 样 的 一 种 拍卖 形式 是 DSIC 的 。 

(b) 假设 竞拍 者 都 如 实 报价 ， 证 明 如 果 估 值 和 竞拍 者 到 来 的 顺序 都 是 任意 
的 ， 那么 对 于 每 一 个 入 无关 的 大 于 0 的 常数 <c， 都 不 存在 确定 性 的 
在 线 拍卖 机 制 ， 使 得 其 社会 福利 至 少 是 最 大 估 值 的 c 售 。 

(c)( 昌 ) 假 设 竞 拍 者 都 如 实 报价 。 证 明 存在 一 个 和 无 关 的 大 于 0 的 常数 
c， 以 及 一 个 确定 性 的 在 线 拍卖 机 制 ， 能 够 有 如 下 保证 : 对 于 每 一 组 无 
序 的 2 个 竞拍 者 的 佑 值 组 合 ， 如 果 竞 拍 者 的 到 达 时 间 符 合 均匀 的 随机 
顺序 ， 那 么 拍卖 的 期 望 社会 福利 最 少 是 最 大 估 值 的 < FFF o 


问题 2.2 假设 二 价 拍卖 中 有 一 个 竞拍 者 子 集 S 决定 共 谋 ， 他 们 协调 好 进行 报价 ， 以 


求 最 大 化 效用 之 和 。 假 设 除 此 集合 外 ， 其 他 竞拍 者 都 如 实 报价 。 求 共 谋 者 
能 够 提高 效用 之 和 的 充分 必要 条 件 ( 关 于 S 的 充分 必要 条 件 ) 。 


问题 2.3 我 们 已 经 证 明 ， 假 设 每 一 个 竞拍 者 的 效用 函数 都 是 拟 线性 的 ， 即 估 值 为 v 


的 竞拍 者 以 价格 p 买 到 物品 时 其 效用 为 v; 一 p， 二 价 拍卖 是 DSIC 的 。 现 在 
如 果 将 竞拍 者 的 效用 函数 的 假设 放宽 ， 讨 论 在 什么 样 的 效用 函数 下 ， 如 实 
汇报 自己 的 估 值 仍然 是 占 优 策略 。 
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在 上 一 章 中 ,我 们 阐述 了 如 何 使 用 “两 步 ” 方 法 来 设计 同时 满足 DSIC、 社 会 福 
利 最 大 化 和 计算 高 效 的 拍卖 机 制 (参考 2. 6. 4 节 )。 第 一 步 是 假设 竞拍 者 都 按照 真实 估 
值 来 进行 出 价 ， 在 此 基础 上 设计 一 个 分 配 规则 ， 从 而 实现 社会 福利 最 大 化 。 例 如 ， 在 
关键 字 搜 索 拍 卖 问 题 中 ,我 们 可 以 将 质量 排 在 第 i 位 的 广告 位 分 配给 出 价 第 i 高 的 竞 
拍 者 。 第 二 步 是 设计 一 个 合适 的 卖 价 ， 从 而 使 真实 报价 成 为 一 个 占 优 策略 。 本 章 中 ， 
我 们 将 阐述 并 证 明 迈 尔 森 引 理 (Myerson7s Lemma)。 迈 尔 森 引 理 是 一 个 强大 且 通 用 
的 理论 工具 ， 它 可 以 帮助 我 们 实现 上 述 第 二 步 操作 。 我 们 可 以 将 迈 尔 森 引 理 应 用 到 关 
键 字 搜索 拍卖 问题 上 。 另 外 ,在 第 4、5 章 中 ， 也 会 讲述 更 多 有 关 迈 尔 森 引 理 的 应 用 。 

3. 1 节 介 绍 单 参数 环境 ， 单 参数 环境 是 将 机 制 设计 问题 进行 泛 化 的 一 种 简便 的 方 
法 。3. 2 节 从 分 配 规则 和 支付 规则 设计 的 角度 ， 重 新 探讨 密封 二 价 拍卖 机 制 的 三 个 环 
节 。3. 3 节 给 出 和 分 配 规则 密切 相关 的 两 个 特性 ， 即 可 实施 性 和 单调 性 ， 并 在 此 基础 
上 阐述 迈 尔 森 引 理 。3. 4 节 将 对 迈 尔 森 引 理 进 行 简要 的 证 明 ， 在 第 一 次 阅读 本 章 时 ， 
3.4 节 可 以 先 跳 过 。 迈 尔 森 引 理 给 出 了 DSIC 机 制 下 的 支付 规则 的 明确 解析 式 。3. 5 
节 将 这 个 解析 式 引 入 关键 字 搜 索 拍 卖 问题 ， 


3.1 单 参 数 环境 


可 以 用 单 参数 环境 来 简单 闵 述 迈 尔 森 引 理 。 在 单 参 数 环境 中 ， 有 n 个 智能 体 ， 每 
个 智能 体 i 都 对 单个 物品 有 非 负 的 估 值 ， 此 估 值 为 私人 信息 ， 记 作 w。 最 后 ， 有 一 个 
TEX. X 中 的 每 个 元 素 x 都 是 一 个 维 向 量 (zi ，z，…，xz)， 其 中 心 表示 智能 
体 i 获得 的 物品 数量 。 

例 3. 1( 单 物品 拍卖 ) 在 一 个 单 物品 拍卖 中 (参考 2.1 节 )， 和 就 是 所 有 0-1 向 量 
x 所 组 成 的 集合 ， 并 且 对 于 任意 一 个 x 都 有 Sa <1, 

例 3.2(k 物品 拍卖 ) 如 果 有 上 大 个 相同 的 物品 进行 拍卖 ， 并 且 每 个 竞拍 者 最 多 获 
得 其 中 一 个 (练习 2.3)， 那 么 可 行 集 X 就 是 所 有 满足 5 xi < k é 0-1 向 量 x 所 组 成 
的 集合 。 








例 3. 3( 关 键 字 搜索 拍卖 ) 在 关键 字 搜 索 拍 卖 中 (参考 2.6 节 )，X 描述 的 是 将 广 
告 位 分 配给 竞拍 者 的 所 有 可 能 分 配方 式 x 的 集合 。 一 个 竞拍 者 最 多 获得 一 个 广告 位 ， 
并 且 一 个 广告 位 最 多 分 配给 一 个 竞拍 者 。 如 果 竞 拍 者 i 得 到 了 广告 位 ij， 那 么 x 中 的 
分 量 X; 就 等 于 其 所 获得 的 广告 位 的 点 击 率 aj。 

例 3.4( 公 共 项 目 决策 ) 公共 项 目 决 策 是 指 决定 是 否 修建 一 个 供 所 有 人 共享 的 公 
共 项 目 ， 比 如 一 座 桥 。 公 共 项 目 决 策 可 以 被 建 模 为 可 行 集 义 二 {(0, 0, e., 0, (1， 
1, ==; I)a 

例 3.4 告诉 我 们 ， 单 参数 环境 足够 通用 ， 它 不 仅 能 够 用 来 刻画 拍卖 问题 ， 也 能 刻 
画 其 他 很 多 场景 。 考 虑 到 这 样 的 通用 性 ， 在 之 后 的 讲述 中 ， 我 们 将 使 用 更 为 宽泛 的 短 
能 体 (agent) 一 词 ， 而 不 再 使 用 较为 狭义 的 竞拍 者 (bidder)。 同 样 ， 我 们 也 会 使 用 报告 
(report) 一 词 来 代替 出 价 (bid)。 在 此 基础 上 ， 机 制 (mechanism) 就 是 在 每 个 智能 体 都 
具有 私人 信息 的 条 件 下 ， 系 统 所 进行 的 决策 。 而 拍卖 (auction) 仅 仅 是 处 理 物品 -金钱 
交换 的 一 类 特殊 机 制 。 对 比 关系 参见 表 3. 1。 


表 3. 1 拍卖 和 机 制 的 对 比 。 拍 卖 是 机 制 的 一 种 特殊 形式 ， 它 主要 处 理 的 是 物品 和 人 金钱 的 交换 问题 

















拍卖 机 制 

竞拍 者 智能 体 

出 价 报告 (也 称 为 上 报 、 汇 报 ) 
估 值 估 值 


3.2 分 配 规 则 和 支付 规则 


在 密封 二 价 拍卖 中 ， 机 制 设 计 者 需要 做 两 个 决策 : 一 是 谁 获得 物品 ， 二 是 定 出 每 
个 人 需要 付 多 少 钱 。 这 两 个 决策 分 别 被 称 为 分 配 规则 和 支付 规则 。 二 价 拍卖 需要 完成 
FS. 





1 收集 所 有 智能 体 的 出 价 b= 二 (bi ，…，5b,)。 我 们 将 向 量 b 称 为 出 价 向 量 或 出 价 
组 合 。 

2. [分 配 规则 ] 选 择 一 个 可 行 的 分 配 x(DECXCR’, 这 个 分 配 是 出 价 向 量 的 函数 。 

3. [支付 规则 ] 选 择 一 个 支付 p(b)ER"， 它 也 是 出 价 向 量 的 函数 。 














在 这 个 流程 中 ， 因 为 在 第 一 步 的 时 候 ， 机 制 要 求 智能 体 直 接地 显露 其 私人 估 值 ， 
所 以 二 价 拍卖 这 样 的 机 制 被 称 为 直接 显示 机 制 (direct-revelation mechanism), tH Æ JẸ 
直接 机 制 ， 例 如 和 迭代 升 价 拍 卖 就 是 其 中 之 一 (参见 练习 2.7) 。 

如 果 收 益 函 数 是 拟 线性 的 (quasilinear)， 那 么 给 定 智 能 体 的 出 价 向 量 bp， 在 一 个 
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分 配 函 数 和 支付 函数 分 别 为 x 和 pp 的 机 制 下 ,智能 体 i 的 收益 函数 计算 如 下 : 

ui(b) = v; » zxi(b) — p; (b) 
其 中 ,支付 规则 应 该 满足 ， 对 于 每 个 智能 体 i 和 所 有 可 能 的 出 价 向 量 b， 都 有 

pi(b) € [0,b,» zi(b)] (3. 1) 
之 所 以 有 p;(b) 宇 9， 是 为 了 保证 卖家 不 倒 找 钱 给 买 家 ; 之 所 以 有 pib Kb xb), 
是 为 了 保证 如 实 汇报 自己 真实 估 值 的 智能 体 的 收益 非 负 ( 你 是 否 能 理解 为 什么 ?)。® 


3.3 迈 尔 森 引 理 的 内 容 


下 面 两 个 重要 的 定义 阐述 了 分 配 规则 应 具有 哪些 良好 的 特性 。 

定义 3.5( 可 实施 的 分 配 规则 ) ”对 于 一 个 单 参数 环境 ， 对 于 一 个 分 配 规则 x， 如 
果 存 在 一 个 支付 规则 p 使 得 直接 显示 机 制 (x，p) 是 DSIC 的 ， 那 么 ， 就 称 这 个 分 配 规 
则 x 是 可 实施 的 。 

也 就 是 说 ， 那 些 能 够 被 扩展 成 DSIC 机 制 的 分 配 规则 才 是 可 实施 的 。 同 理 ，DSIC 
机 制 在 分 配 规则 空间 上 的 投影 就 是 可 实施 的 分 配 规则 的 集合 。 如 果 我 们 的 目标 是 设计 
DSIC 的 机 制 ， 那 么 必须 限定 在 可 实施 的 分 配 规 则 范围 内 ， 即 可 实施 的 分 配 规则 决定 
了 “机 制 设计 的 空间 ”。 根 据 以 上 定义 ， 在 第 2 章 最 后 所 探讨 的 关键 字 搜 索 拍 卖 就 可 
以 被 归 约 为 :最 大 化 社会 福利 的 分 配 规则 (即将 第 i 个 广告 位 分 给 出 价 第 i 高 的 竞拍 
者 )， 这 样 的 分 配 规则 是 否 是 可 实施 的 ? 

例如 ， 考 虑 一 个 单 物品 拍卖 的 场景 ( 例 3. 1)， 将 物品 分 给 最 高 出 价 者 的 分 配方 式 
是 否 是 可 实施 的 ? 当然 是 。 因 为 我 们 已 经 找到 了 一 种 支付 规则 ， 即 赢家 支付 第 二 高 价 
格 。 这 样 的 最 高 价 出 价 者 胜出 ， 结 合 支 付 第 二 高 价格 的 机 制 ， 是 满足 DSIC 的 。 那 如 
果 是 将 物品 分 配给 出 价 第 二 高 的 竞拍 者 呢 ? 答案 并 不 明朗 ， 因 为 还 没 看 到 过 这 样 的 分 
配 结合 哪 种 支付 规则 才能 使 机 制 满足 DSIC。 但 是 ， 也 不 能 轻易 证 明 对 于 这 样 的 分 配 
规则 并 不 存在 相对 应 的 支付 规则 。 

定义 3.6( 单 调 分 配 规则 ) ”如 果 对 于 每 个 智能 体 i 和 所 有 其 他 智能 体 的 出 价 向 量 
bi, MPRA i 的 分 配 函 数 z;(z，b_;) 是 i 的 出 价 z 的 单调 非 减 函数 ， 那 么 就 称 一 个 
分 配 规 则 x 是 单调 的 。 

也 就 是 说 ， 在 一 个 单调 分 配 规则 下 ， 更 高 的 出 价 会 为 你 赢得 更 多 的 物品 。 

例如 ， 在 单 物 品 拍卖 中 ， 如 果 分 配 规则 是 最 高 出 价 者 得 ， 那 么 当 赢 家 提高 报价 
时 ， 他 仍然 会 是 赢家 。 相 比 之 下 ， 将 物品 分 配给 第 二 高 出 价 者 的 分 配方 式 并 不 是 一 个 
单调 的 分 配 规则 。 因 为 在 这 样 的 分 配 下 ， 如 果 赢 家 过 高 报价 ， 他 反而 有 可 能 会 失去 





些 应 用 中 ， 这 两 个 限制 有 可 能 会 被 放松 ， 这 样 的 放松 在 特定 情境 下 是 合理 的 。 参 见 练习 2.5 和 问 
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物品 。 

在 关键 字 搜 索 拍卖 中 ( 例 3. 3)， 如 果 将 第 i 个 广告 位 分 配给 出 价 第 i 高 的 竞拍 者 ， 
这 样 的 分 配 规则 是 单调 的 。 这 是 因为 ， 当 一 个 竞拍 者 抬 高 报价 时 ， 他 的 排 位 只 可 能 升 
高 ， 并 因此 获得 更 好 的 广告 位 、 更 高 的 点 击 率 。 

现在 我 们 开始 阐述 迈 尔 森 引 理 的 三 个 部 分 。 每 一 部 分 都 很 有 趣 ， 而 且 在 后 面 的 应 
用 中 都 很 有 用 。 

定理 3. 7( 迈 尔 森 引 理 ) 在 一 个 单 参 数 环 境 下 : 

(a) 一 个 分 配 规则 x 是 可 实施 的 ， 当 且 仅 当 它 是 单调 的 。 

(b) 如 果 x 是 单调 的 ， 那 么 存在 唯一 的 支付 规则 ,使 得 直接 显示 机 制 (X，p) 是 
DSIC 的 ， 且 使 得 对 于 所 有 报价 4b; 二 0 34 A p;(b)=0, 

Ce) (b) 中 的 支付 规则 有 明确 的 表达 式 。S 

抱 尔 森 引 理 是 本 书 中 大 部 分 机 制 设计 理论 的 基石 。 其 中 (a) 部 分 告诉 我 们 ， 定义 
3.5 和 3.6 中 所 定义 的 两 类 分 配 规则 实际 上 是 等 价 的 。 这 两 个 定义 的 等 价 有 着 非凡 的 
BM: 定义 3.5 描绘 了 机 制 设 计 的 目标 ,但 是 我 们 仅仅 知道 这 个 抽象 的 目标 ， 并 不 知 
道 该 怎样 将 它 实 施 ; 定义 3.6 所 述 的 内 容 更 便于 我 们 的 实际 操作 ， 因 为 通常 情况 下 ， 
检查 一 个 分 配 规则 是 否 单调 并 不 是 很 难 的 事 。 现 在 这 两 者 等 价 了 ， 如 何 设 计 可 行 的 分 
配 规 则 就 变 得 非常 清晰 。(b) 部 分 告诉 我 们 ， 如 果 一 个 分 配 规 则 是 可 实施 的 ， 那么 如 
何 设计 支付 规则 就 已 经 清楚 了 : 只 有 唯一 的 设计 方式 。 更 进一步 ，(c) 部 分 告诉 我 们 ， 
支付 规则 有 着 明确 的 解析 式 。 在 3. 5 节 的 关键 字 搜 索 拍 卖 设 计 以 及 第 5、6 章 的 收益 
最 大 化 拍卖 设计 中 ，(c) 部 分 的 结论 均 发 挥 了 重要 的 作用 。 


3.4 ARRIE HUE AA 


在 一 个 单 参数 环境 下 ， 假 设 有 一 个 单调 或 非 单 调 的 分 配 规则 x 和 一 个 支付 规则 
pP， 机 制 (x，p) 是 DSIC 的 。 那 么 问题 是 : 支付 规则 p 应 该 是 什么 形式 的 ?我 们 的 方 
法 是 使 用 DSIC 的 严格 约束 条 件 来 找到 唯一 的 p。 下 面 我 们 一 气 呵 成 将 迈 尔 森 引 理 的 
三 个 部 分 一 起 证 明 。 

回忆 DSIC 的 条 件 是 : 对 于 任意 智能 体 i、 任 意 可 能 的 估 值 vw;、 任 意 其 他 智能 体 的 
出 价 组 合 b-;， 当 i 真实 报价 的 时 候 ， 其 收益 能 够 最 大 化 。 针 对 任意 一 个 固定 的 i 和 
bs 的 报价 为 z， 为 了 简化 书写 , 将 xz;(z，b_;) 记 为 Xz(z)， 将 p; (xz，b_;) 记 为 
plz). A 3. 1 展示 了 两 种 分 配 规则 的 图 。 这 些 曲 线 实际 上 是 以 x 为 变量 的 x 函数 的 
图 像 。 


O 更 多 细节 参见 公式 (3.5) 和 (3. 6)。 更 翔实 的 例子 参见 3.5 节 。 
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x(z) x(z) 
1 Gma 1 下 
ea 
De 
0 0 
Z z 
a) 0-1] 单 调 分 配 曲 线 b) 分 段 常 函数 单调 分 配 曲线 


图 3.1 分 配 曲线 的 例子 


我 们 通过 一 种 简单 但 聪明 的 交换 技巧 来 引入 DSIC AR, 假设 机 制 (x，p) 是 
DSIC 的 ， 且 有 任意 的 两 个 变量 0 委 > 志 >。 一 种 可 能 的 情况 是 ， 智 能 体 ; 的 私人 估 值 是 
<， 提 交 的 报价 是 y， 即 低 于 估 值 报价 。 在 这 种 情况 下 ，DSIC 要 求 以 下 公式 成 立 : 





ze ax(z) — plz) Sze xly)— ply) C3. 2) 
v kg 
报价 为 = 时 的 收益 报价 为 y 时 的 收益 


同样 ， 另 一 种 可 能 的 情况 是 ， 智 能 体 ; 的 私人 估 值 是 y， 提 交 的 报价 是 z=， 即 高 
于 估 值 报价 。 在 这 种 情况 下 ，DSIC 要 求 以 下 公式 成 立 : 
ys aly) 一 力 (3) Sy « a) — plz) (3. 3) 


报价 为 > 时 的 收益 报价 为 z 时 的 收益 


迈 尔 森 引 理 实际 上 是 在 给 定 分 配 规则 (函数 x) 的 情况 下 来 求解 支付 规则 (函数 p) 
的 问题 。 将 公式 (3.2) 和 (3. 3) 移 项 、 合 并 同类 项 之 后 ， 两 式 联 立 可 得 如 下 这 种 “支付 
差 值 ”的 夹 通 形式 : 

g. [zy —a2(z)] < ply) — plz) Sy. Lrx(y) — z(z)] (3. 4) 

这 个 不 等 式 要 求 左 项 小 于 右 项 。 从 这 个 不 等 式 已 经 能 够 看 出 ， 如 果 支 付 规则 可 实施 ， 
就 意味 着 这 个 支付 规则 是 单调 的 (练习 3.1)。 所 以 ， 在 之 后 的 证 明 中 ， 我 们 假设 x 是 
单调 的 。 

下 面 考虑 x 是 分 段 常 函数 (如 图 3. 1 所 示 )。 在 这 个 图 中 , 工 的 函数 图 像 除 了 在 几 
个 间断 点 有 跳跃 外 ， 其 他 地 方 都 是 平坦 的 常数 。 在 公式 (3.4) 中 ， 固定 变 量 z, 令 变 
量 > MER POF. AHE, RM r 的 值 在 x 处 没有 变化 ， 则 不 等 式 的 左 项 
和 右 项 都 为 0; WR x Er MARR, WASH AMATI Az eh. XMH 
bp 的 约束 是 : 对 于 所 有 的 z, 

PP 在 z 处 的 变化 二 xz。[z 在 z 处 的 变化 ] 

将 此 约束 与 初始 条 件 pCO) =0 结合 ， 就 能 得 到 如 下 的 支付 函数 : 对 于 所 有 的 智能 体 
i、 其 他 智能 体 的 报价 向 量 b_;， 以 及 i 的 报价 5;,， 有 


pi(bisb:) = >) z e CnC sbu) 在 z; 处 的 变化 ] (3. 5) 


其 中 ， Zis 9 风 是 分 配 函 数 在 [0， b;] 区 间 内 的 断 点 。 
如 果 工 是 单调 的 但 不 是 分 段 常 函数 ， 也 可 以 得 到 与 以 上 相似 的 结论 。 例 如 ， 如 果 
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工 可 微 ， 那 么 将 公式 (3.4) 除 以 y 一 *， 当 y 从 上 到 下 无 穷 接 近 z 时 ,约束 条 件 就 
变 为 

p (z) = z+ x (z) 
将 此 约束 与 初始 条 件 pCO) =0 结合 ， 就 能 得 到 如 下 的 支付 函数 : 对 于 所 有 的 智能 体 
i、 其 余 智 能 体 的 报价 向 量 b-_; 以 及 i 的 报价 5;:， 有 


b 
B brb) = | x: 所 zi(zsb-)dz (3. 6) 
0 之 


特别 需要 重申 的 是 ， 上 述 支付 函数 就 是 在 给 定 分 配 函 数 x 后 能 实现 DSIC 机 制 的 
唯一 支付 规则 。 因 此 ， 对 于 每 一 个 分 配 规则 x， 最 多 仅 有 一 个 支付 规则 p 使 得 机 制 是 
DSIC 的 ( 即 定 理 3.7(b) 部 分 所 述 )。 但 是 我 们 的 证 明 还 没有 完成 ， 因 为 我 们 仍然 需要 
检查 给 定 一 个 单调 的 分 配 规则 x 后， 上面 这 样 的 支付 规则 是 否 能 达到 目的 。 

我 们 通过 图 3. 2 KWEH, WR x 是 单调 的 分 段 常数 函数 ， 且 支付 规则 符合 公 
式 (3.5) 的 形式 ， 那 么 机 制 (x，p) 是 DSIC 的 。 相 同 的 证 明 也 适用 于 更 加 一 般 化 的 单 
调 但 非 分 段 常 函数 的 分 配 规则 ， 公 式 (3.6) 给 出 了 这 样 的 分 配 规 则 下 的 支付 规则 。 完 
成 了 这 部 分 的 图 示 讨 论 ， 迈 尔 森 引 理 的 证 明 就 完成 了 。 











x(z), x(z) 
1 1 
o v=b z a u z 
d) p(v) f) p(b), b<v 
x(z), 
1 
0 
v=b z b v z 
g) b=v 时 的 收益 h) b>v 时 的 收益 i) b<v 时 的 收益 


图 3.2 使 用 图 示 的 方式 证 明 : 公式 (3.5) 中 的 支付 规则 和 单调 的 分 段 常 函数 分 配 规则 给 出 了 一 个 
DSIC 的 机 制 。 上 图 中 的 三 列 从 左 到 右 分 别 为 真实 报价 、 高 于 估 值 报价 、 低 于 估 值 报价 。 
从 上 到 下 每 一 行 分 别 表示 社会 福利 v* x(5)、 支 付 规则 p(5) 和 收益 vv， r) p). ÆR h 
中 ， 灰 色 阴 影 区 表示 正 的 收益 ， 斜 线 区 表示 负 的 收益 


O 根据 一 些 额 外 的 微 积分 理论 ， 就 可 以 将 证 明 扩展 到 一 般 化 的 单调 函数 上 。 
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图 3. 2a~i 所 描绘 的 分 别 是 当 智 能 体 真 实 报价 、 虚 高 报价 、 虚 低 报 价 时 所 获得 的 
收益 。 在 这 三 种 情况 下 ,分 配 函 数 曲线 x(z) 和 智能 体 的 私人 估 值 v 都 是 一 样 的 。 当 
智能 体 的 报价 为 65 时， 其 收益 计算 为 w.，x(5) 一 p(5b)。 图 3.2a、b、c 中 灰色 和 矩形 的 面 
ERE v. zx(b) 的 值 。 根 据 公式 (3.5), 图 3.2d4、e、f 中 灰色 和 矩形 的 面积 就 是 智能 体 
的 支付 p(5) 的 值 。 最 后 一 行 的 图 3. 2g、h、i 中 的 灰色 部 分 面积 就 是 以 上 两 项 的 差 值 。 
我 们 可 以 看 到 ， 当 智能 体 按照 真实 估 值 报价 时 ， 其 收益 就 是 L0，wj 区 间 内 分 配 函 数 曲 
线 以 下 区 域 的 面积 (图 3. 2g)。 当 智能 体 虚 高 报价 时 ， 其 收益 是 相同 的 区 域 再 减 去 Lv， 
bj] 区 间 内 分 配 函 数 曲 线 以 上 区 域 的 面积 (图 3. 2h)。 当 智能 体 虚 低 报价 时 ， 其 收益 应 
该 是 [0，w] 区 间 内 分 配 函 数 曲 线 以 下 区 域 的 某 个 子 集 的 面积 (图 3. 2i) 。 因 为 在 真实 报 
价 时 相应 区 域 的 面积 最 大 ， 所 以 这 样 的 机 制 是 DSIC 的 。 证 毕 。 


3.5 支付 公式 的 运用 


迈 尔 森 引 理 给 出 的 明确 的 支付 规则 (定理 3.7(c)) 很 容易 理解 ,我们 可 以 将 这 个 
结论 应 用 到 很 多 场景 下 。 先 考虑 例 3. 1 中 提 到 的 场景 : 在 一 个 单 物品 拍卖 中 ， 分 配 规 
则 是 将 物品 分 配给 最 高 出 价 者 。 针 对 一 个 特定 的 出 价 者 i 以 及 其 他 出 价 者 的 报价 向 量 
b-;， 分 配 函 数 x,(z，b-) 的 值 在 模 轴 到 达 点 B= max bj 之 前 都 是 0， 在 这 之 后 都 是 1。 
在 这 样 一 个 单调 的 分 段 常 函数 的 分 配 规 则 下 ， 根 据 3.4 节 中 公式 (3.5)， 可 以 得 到 如 
下 迈 尔 森 的 支付 函数 : 


‘ 


p: (biba) = >) z;，。[xi(*,b_i) Ez 处 的 变化 ] 


其 中 ，zi ，…，z% 是 分 配 函 数 z;(。，b-;) 在 [0，b;] 区 间 内 的 断 点 。 在 单 物 品 拍 卖 中 ， 
最 高 出 价 者 得 这 个 分 配 规则 的 值 要 么 是 0(6; 二 B 时 )， 要 么 是 1( > Bit). XA AR 
Zzi(，，b_,) 仅 有 一 个 断 点 ( 即 在 横 轴 为 B， 纵 轴 变 化 为 1 处 的 断 点 )。 所 以 ,支付 函 
数 的 值 是 p;(b;，b_;) 二 B。 以 上 分 析 可 见 ， 从 迈 尔 森 引 理 的 角度 来 看 ， 二 价 拍卖 的 支 
付 规则 是 它 的 一 种 应 用 实例 。 

下 面 我 们 思考 在 关键 字 搜索 拍卖 ( 例 3.3) 中 ， 一 共有 上 个 广告 位 ， 点 击 率 分 别 是 
ara Say. S 关切 表示 分 配 规则 ， 对 于 所 有 的 三 1，2，…，A&， 将 质量 第 ; 好 
的 广告 位 分 配给 出 价 第 ; 高 的 竞拍 者 。 这 个 分 配 规 则 是 单调 的 ， 而 且 ， 如 果 竞 拍 者 的 
出 价 都 是 真实 估 值 ， 它 也 能 使 得 社会 福利 最 大 化 (练习 2.8)。 在 这 个 x HE. BD 
尔 森 的 支付 公式 可 以 给 出 唯一 的 支付 规则 p， 使 机 制 (x，p) 是 DSIC 的 。 如 果 所 有 竞 
拍 者 的 报价 向 量 为 bp， 对 所 有 报价 从 高 到 低 排 序 有 bb 三 bs 宇 … 三 5b,。 考 虑 最 高 报价 者 ， 
如 果 其 他 竞拍 者 的 报价 固定 ， 在 其 报价 从 0 升 高 到 入 的 过 程 中 ， 其 分 配 函 数 
x1(z，b-1) 的 值 从 0 升 高 到 w 。 当 其 报价 从 第 j 十 1 高 变 成 第 j 高 ( 记 为 5611) 时 ， 其 分 
配 函 数 的 增 量 为 a 一 a;;1。 根 据 以 上 原理 ， 由 迈 尔 森 引 理 得 知 第 i 高 的 报价 者 的 支付 
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函数 计算 如 下 (其 中 ak 一 0): 
k 
Ph = 2 baa Cay aps) (3. 7) 


我 们 上 面 所 讨论 的 关键 字 搜 索 拍 卖 的 模型 中 ， 假 设 竞拍 者 关心 的 不 是 自己 的 链接 
显示 在 哪里 ， 而 是 关心 是 否 被 点 击 。 这 种 情况 下 ， 可 以 根据 每 次 点 击 来 计算 支付 。 竞 
拍 者 i 在 第 i 个 广告 位 上 的 单位 点 击 量 支 付 的 计算 很 简单 ， 就 是 对 公式 (3. 7) 进 行 1/a 
的 缩小 。 


k 
pi(b) = >) bj + (3.8) 
jmi Qi 


据 此 可 见 ， 每 当 一 个 竞拍 者 的 链接 被 点 击 ， 实 际 上 他 需要 支付 的 数额 是 比 他 低 的 其 他 
报价 的 一 个 凸 组 合 。 

由 于 历史 原因 ， 搜 索引 擎 所 使 用 的 关键 字 搜 索 拍卖 是 基于 “广义 二 价 ”(GSP) 拍 
卖 的 ， 这 是 一 种 比 上 述 DSIC 的 拍卖 更 简单 的 机 制 。GSP 的 分 配 规 则 同样 是 将 第 i 好 
的 广告 位 分 配给 出 价 第 i 高 的 竞拍 者 , 但 是 它 对 这 位 竞拍 者 收取 的 价格 是 第 (i 十 1) 高 
的 报价 的 数额 。 对 于 相同 的 报价 集合 ，GSP 的 单位 点 击 支付 额度 要 比 公式 (3.8) 中 的 
Ea. HRR ERN, ARG. 8) 中 的 支付 形式 是 唯一 能 保证 DSIC 的 形式 。 
所 以 ，GSP 拍卖 并 不 是 DSIC 的 。 但 是 它 仍然 有 一 些 良好 的 性 质 ， 而 且 在 某 种 意义 
E, CA DSIC 的 拍卖 机 制 是 等 效 的 。 问 题 3. 1 将 具体 讨论 这 个 问题 。 


总 结 


。 在 一 个 单 参数 环境 中 ， 每 个 智能 体 都 有 对 单位 物品 的 私人 估 值 。 一 个 可 行 集 
定义 了 有 多 少 物 品 可 以 被 分 配给 智能 体 。 其 实例 包括 单 物品 拍卖 、 关 键 字 搜 
索 拍卖 和 公共 项 目 决策 。 

。 直接 显示 机 制 的 分 配 规则 是 所 有 智能 体 报价 的 函数 ， 它 决定 了 哪些 智能 体 得 
到 哪些 物品 。 支 付 规则 也 是 所 有 智能 体 报价 的 函数 ， 它 决定 了 哪些 智能 体 支 
付 多 少 。 

e 对 于 一 个 分 配 规则 ， 如 果 存 在 一 个 支付 规则 使 得 整个 机 制 是 DSIC 的 ， 那 么 这 

个 分 配 规则 就 是 可 实施 的 。 

对 于 一 个 分 配 规则 ， 在 其 他 智能 体 报价 固定 的 情况 下 ， 如 果 一 个 智能 体 更 高 

的 报价 只 会 使 其 获得 更 多 的 物品 ， 那 么 这 个 分 配 规则 就 是 单调 的 。 

e 迈 尔 森 引 理 说 明 ， 一 个 分 配 规则 是 可 行 的 ， 当 且 仅 当 它 是 单调 的 ， 并 且 相应 

的 支付 规则 存在 且 唯 一 (假设 报价 为 0 时 支付 亦 为 0) 。 

公式 (3. 5) 和 (3.6) 给 出 了 在 单调 的 分 配 规则 下 能 够 实现 DSIC 机 制 的 支付 规则 

的 明确 算式 。 
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e 在 理想 的 关键 字 搜索 拍卖 问题 中 ， 迈 尔 森 的 支付 公式 对 单位 点 击 量 支付 额 的 
计算 非常 优美 。 


说 明 


迈 尔 森 引 理 参见 Myerson(1981)。 公 式 (3. 8) 中 的 关键 字 搜 索 拍 卖 的 支付 公式 参 
UL Aggarwal 等 (2006)。Edelman 等 (2007) 和 Varian(2007) 分 别 涉及 了 问题 3.1 中 所 
述 的 内 容 。Goldberg 等 (2006) 介 绍 的 “profit extractor” 以 及 Moulin 和 Shenker 
(2001) 讨 论 的 成 本 共 挫 机 制 都 与 问题 3.2 有 关联 。 问 题 3. 3 是 Moulin 和 Shenker 
(2001) 论 文 所 讨论 内 容 的 一 个 特例 。 


练习 


练习 3. 1 


练习 3. 2 


练习 3. 3 


练习 3. 4 


问题 


问题 3. 1 


使 用 公式 (3. 4) 中 的 形式 来 证 明 : 如 果 一 个 分 配 规则 不 是 单调 的 ,那么 它 
就 不 是 可 实施 的 。 

在 3.4 节 的 迈 尔 森 引 理 的 证 明 中 ， 使 用 的 是 图 形 化 的 方法 ， 将 单调 的 分 段 
常 函数 分 配 规则 与 公式 (3.5) 所 给 出 的 支付 规则 进行 整合 ， 从 而 得 出 了 机 
制 是 DSIC 的 结论 。 基 于 图 形 化 的 方式 思考 : 如 果 分 段 常 函数 分 配 规则 x 
不 是 单调 的 ， 以 上 证 明 是 如 何 失 效 的 ? 

使 用 代数 的 方法 证 明 : 单调 的 分 段 常 函数 的 分 配 规则 结合 公式 (3.5) 所 给 
出 的 支付 规则 形成 一 个 DSIC 的 机 制 。 

考虑 以 下 对 于 关键 字 搜 索 拍 卖 的 扩展 。 对 于 每 个 竞拍 者 i， 除 了 私人 估 值 
v;， 都 有 一 个 公开 的 质量 8;:。 一 般 来 说 ， 每 一 个 广告 位 7 都 对 应 一 个 点 击 
Raj ， 并 且 wm 宇 as 宇 … 宇 a:。 假 设 如 果 竞 拍 者 i 被 分 配 到 广告 位 i， 则 一 次 
点 击 的 概率 为 Ba;。 这 样 的 话 ， 竞 拍 者 i 对 于 广告 位 ; 的 估 值 就 是 v;Bia,。 
针对 此 情境 ， 实 现 一 个 最 大 化 社会 福利 的 分 配 规则 。 证 明 这 个 分 配 规则 是 
单调 的 。 结 合 这 个 分 配 规 则 ， 给 出 一 个 具有 明确 函数 形式 的 单位 点 击 的 支 
付 规则 ， 从 而 实现 一 个 DSIC 的 机 制 。 


回忆 2.6 节 中 的 关键 字 搜索 拍卖 问题 : 一 共 & 个 广告 位 ， 其 中 第 7 个 广告 
位 的 点 击 率 是 a; GG 越 大 aj; 越 小 )。 如 果 将 竞拍 者 i 分配 到 广告 位 i， 则 其 收 
益 是 aj (v; 一 p;)， 其 中 vw 是 i 对 单位 点 击 量 的 估 值 ，p; 是 i 对 第 j 个 广告 位 
上 单位 点 击 量 的 支付 。 广 义 二 价 拍卖 (GSP) 的 定义 如 下 : 
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i 
2. 
3. 


广义 二 价 (GSP) 拍 卖 
按照 报价 将 竞拍 者 从 高 到 低 排 序 扩 宇 bs 宇 … 三 b,。 
对 任意 的 i 二 1，2，…，k， 将 第 i 个 竞拍 者 分 到 第 i 个 广告 位 。 
对 任意 的 i 二 1]，2，…，k， 其 支付 是 每 次 点 击发 生 都 支付 bi+1。 








以 下 几 个 子 问题 表明 ， 广 义 二 价 拍卖 中 ， 有 一 个 均衡 是 和 相应 的 DSIC 的 
关键 字 搜 索 拍 卖 中 的 “说 真 话 ” 的 均衡 等 价 的 。 


(a) 


(b) 


w 


ce 


(d) 


Ce) 


证 明 对 于 所 有 的 ka? 及 所 有 可 能 的 序列 San SS a>, GSP 拍 
卖 并 不 是 DSIC 的 。 
(H) 固 定 所 有 广告 位 的 CTR 和 竞拍 者 对 单位 点 击 量 的 估 值 。 通 过 增加 
虚拟 的 点 击 量 为 0 的 广告 位 ， 或 者 增加 虚拟 的 单位 点 击 量 估 值 为 0 的 
竞拍 者 ， 我 们 可 以 使 k= 二 n。GSP 中 ， 如 果 在 一 个 竞价 组 合 b 中 ， 没 有 
任何 一 个 竞价 者 可 以 通过 单方 面 改 变 报 价 来 提升 自己 的 收益 ,那么 b 
就 是 GSP 的 一 个 均衡 。 验 证 在 我 们 的 假设 bh 三 b; 宇 … 宇 b, 之 下 ， 以 上 
均衡 的 条 件 可 以 转化 为 下 面 的 不 等 式 系 统 ， 对 于 每 一 个 i 和 排 位 更 靠 
前 的 广告 位 7 过 i 

a; Cu; — ba) = a; Cv; — 6;) 
并 且 对 于 每 一 个 排 位 更 靠 后 的 广告 位 ， 

ai (vu; — biaa) & a; Cu; — bj) 
如 果 对 于 每 个 竞拍 者 CA AA, MBA 

a; (Vi— bin) & a; Cu; — bt) (3. 9) 
则 满足 顺序 b Sb, SS, ISEB A b 就 是 无 嫉妒 的 。 证 明 每 一 个 无 
嫉妒 的 竞价 组 合 都 是 一 个 均衡 。S 
(H) 如 果 公 式 (3. 9) 对 于 每 一 对 相 邻 的 广告 位 成 立 ， 即 对 于 任意 一 对 i 
和 jE(i 一 1，i 十 1) 成 立 ， 则 竞价 组 合 就 被 称 为 局 部 无 嫉妒 的 。 根 据 定 
义 ， 一 个 无 嫉妒 的 竞价 组 合 也 是 局 部 无 嫉妒 的 。 证 明 : 对 于 每 一 组 严 
格 递减 的 CTR， 每 一 个 局 部 无 嫉妒 的 竞价 组 合 都 是 无 嫉妒 的 。 
(HH) 证 明 : 对 于 每 一 个 单位 点 击 量 的 估 值 组 合 和 严格 递减 的 CTR, 
GSP 拍卖 中 都 存在 一 个 均衡 ， 在 这 个 均衡 下 ， 竞 拍 者 向 广告 位 的 分 配 
以 及 所 有 的 单位 点 击 量 的 支付 ， 都 等 于 所 对 应 的 DSIC 关键 字 搜 索 拍 
卖 中 的 所 有 竞拍 者 如 实 报 价 时 的 结果 。 


O ”为 什么 被 称 为 “无 嫉妒 ” 呢 ? 这 是 因为 ， 如 果 我 们 将 当前 第 了 了 个 广告 位 的 单位 点 击 量 价格 写 为 六 一 


bir1， 则 这 些 不 等 式 的 意思 就 是 : 每 一 个 竞拍 者 都 更 青睐 自己 当前 所 得 的 广告 位 及 支付 ， 因 为 如 果 他 
被 分 配 到 另 一 个 广告 位 并 支付 那个 广告 位 当前 的 价格 ,他 的 收益 不 会 升 高 。 
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(O 证 明 (e) 中 的 均衡 是 无 嫉妒 竞价 组 合 中 卖家 收益 最 小 的 。 
问题 3. 2 ”这 个 问题 考虑 的 是 上 单位 物品 拍卖 ( 例 3.2)， 在 此 拍卖 中 ， 卖 家 有 一 个 确 
定 的 收益 目标 尺 。 考 虑 如 下 算法 ， 给 定 输入 bp， 确定 赢家 及 其 支付 。 





收益 目标 拍卖 
初始 化 排名 前 的 竞拍 者 为 集合 S 
while 存在 一 个 竞拍 者 iC S, b,<R/|S| do 
从 集合 S 中 移 除 任意 一 个 这 样 的 竞拍 者 
为 集合 S 中 的 每 一 位 竞拍 者 (如 果 有 ) 以 价格 R/|S| 分 配 一 个 物品 











Ca) 为 收益 目标 拍卖 的 分 配 规 则 给 出 一 个 清晰 描述 ， 并 证 明基 单调 性 。 

(b)( 旦 ) 根 据 迈 尔 森 引 理 证 明 收 益 目 标 拍卖 是 一 个 DSIC 机 制 。 

Cc) 证 明 如 果 DSIC 且 福 利 最 大 化 的 单位 物品 拍卖 (练习 2. 3) 的 卖家 收益 
至 少 是 R， 收 益 目 标 拍卖 将 获得 收益 R. 

(d) 证 明 存 在 一 个 估 值 组 合 ， 使 得 收益 目标 拍卖 的 卖家 收益 为 R， 但 是 使 
得 DSIC 且 福 利 最 大 化 的 拍卖 的 卖家 收益 小 于 R. 

问题 3. 3 这 个 问题 再 次 讨论 问题 2. 2 提 到 的 拍卖 中 的 共 谋 问题 。 

(a) 证 明 问题 3. 2 中 的 收益 目标 拍卖 是 防 群 组 策略 的 ， 即 不 存在 由 部 分 竞 
拍 者 共 谋 的 策略 性 报价 ， 使 得 在 共 谋 的 群 组 中 一 人 的 效用 严格 增加 的 
情况 下 ， 群 组 中 其 他 人 的 效用 都 不 严格 减少 。 

(b) DSIC 且 福 利 最 大 化 的 单位 物品 拍卖 是 防 群 组 策略 的 吗 ? 
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本 章 将 在 更 复杂 的 单 参数 环境 下 探究 DSIC、 福 利 最 大 化 和 计算 高 效 的 机 制 是 什 
么 样 的。 这 些 足够 一 般 化 的 环境 使 得 福利 最 大 化 成 为 NP 困难 问题 ， 所 以 ， 我们 只 考 
虑 近似 的 最 大 化 社会 福利 的 分 配 规则 。 要 设计 这 样 的 规则 有 很 多 方法 ， 但 并 非 所 有 的 
方法 都 可 以 产 出 单调 的 分 配 规则 。 本 章 还 会 讨论 显示 原理 ， 它 规范 化 地 诠释 了 我 们 为 
何 将 目标 限定 在 直接 显示 机 制 上 。 


4.1 背包 拍卖 


4.1.1 问题 定义 


背包 拍卖 是 另外 一 个 单 参 数 环境 下 的 拍卖 实例 ( 见 3.1 节 )。 
例 4. 1( 背 包 拍 卖 ) 在 背包 拍卖 中 ， 每 一 个 竞拍 者 i 都 有 一 个 公开 的 规模 vw; 和 
一 个 私有 的 估 值 。 卖 家 有 容量 W。 可 行 集合 义 是 一 个 0-1 AEC, s Tmn), L 


D wr SW., =l 仍然 意味 着 竞拍 者 i 是 拍卖 中 的 一 个 赢家 。) 
i=] 


每 当 需 要 分 配 一 个 总 量 受 限 的 资源 时 ， 你 面 对 的 就 是 一 个 背包 问题 。 例 如 ， 竞 拍 
者 的 规模 可 以 表示 一 个 公司 的 广告 时 长 ; 估 值 是 在 足球 世界 杯 中 场 休息 时 播放 这 个 公 
司 的 广告 ， 该 公司 所 愿意 支付 的 价格 ; 卖家 的 容量 就 是 可 播放 广告 的 总 时 长 。 其 他 可 
以 用 背包 拍卖 来 建 模 的 情景 包括 : 竞拍 者 想 要 将 数据 存放 在 共享 的 服务 器 ， 数 据 流通 
过 共享 的 信道 传输 ， 或 者 用 共享 的 超级 计算 机 进行 计算 等 。 如 果 在 一 个 背包 拍卖 中 ， 
对 于 所 有 的 i 都 有 w; 王 1， 并且 W==k， 这 就 是 一 个 单位 物品 拍卖 ( 例 3. 2) 。 

现在 我 们 使 用 两 步 走 的 模式 (2. 6.4 节 ) 来 为 背包 拍卖 设计 一 个 理想 的 机 制 。 首 
先 ， 假 设 收 到 的 报价 都 是 真实 的 ， 并 给 出 分 配 规则 。 然 后 设计 一 个 支付 规则 ， 从 而 将 
这 个 分 配 规则 扩展 为 一 个 DSIC 的 机 制 。 


加 ”原文 用 词 为 size”， 在 传统 背包 问题 中 也 被 称 为 “大 小 *， 本 书 中 使 用 "规模 "这 一 更 泛 化 的 词 。 
一 一 译 者 注 
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4. 1.2 福利 最 大 化 的 DSIC 背包 拍卖 


一 个 理想 化 的 拍卖 模型 应 该 能 最 大 化 社会 福利 ， 所 以 针对 第 一 阶段 的 答案 很 清 
晰 ， 分 配 规则 应 该 是 


x(b) = argmax >, b, x; (4. 1) 


也 就 是 说 ， 该 分 配 规则 就 是 背包 问题 的 一 个 解 ”。 在 这 个 背包 问题 中 ,物品 的 价值 就 
是 上 报 的 竞价 (5 ，…，b,)， 物品 的 大 小 就 是 竞拍 者 公开 的 规模 (ww ，…，ww, )。 根 据 
定义 ， 当 竞拍 者 如 实 报价 时 ， 该 分 配 规则 可 以 将 社会 福利 最 大 化 。 根 据 定义 3.6 可 
知 ， 这 个 分 配 规则 也 是 单调 的 。 具 体 见 练习 4. 1。 


4. 1.3 关键 报价 


迈 尔 森 引 理 (定理 3.7 的 (a) 和 (b) 部 分 ) 保 证 了 pa 
存在 一 个 支付 规则 p， 使 得 机 制 (x，p) 是 DSIC 的 。 1 De 
这 个 支付 规则 很 容易 理解 。 针 对 一 个 固定 的 竞拍 者 
i， 以 及 其 他 竞拍 者 的 报价 组 合 b_;， 因 为 分 配 规 则 
是 单调 的 且 每 个 竞拍 者 的 分 配 都 是 0 或 1， 所 以 直 0 
到 一 个 断 点 < 之前， 分 配 曲 线 zx;(。，b_;) 将 一 直 
是 0。 在 = 处 分 配 曲 线 跃 迁 到 1( 图 4.1)。 我 们 回忆 
分 配 函 数 的 公式 (3. 5 ) 为 


2 


图 4.1 一 个 单调 的 0-1 分 配 规则 


é 


bibb) = >) zx)，[zxi(*,b_;) Ez 处 的 变化 ] 


其 中 ，zi，…， 是 分 配 函 数 z,(，，b-;) 在 L0，b;] 区 间 内 的 断 点 。 所 以 ， 如 果 i 的 报 
价 低 于 =， 则 他 得 不 到 物品 并 且 支 付 0。 如 果 他 的 报价 高 于 =， 他 将 支付 z。(1 一 0) 三 
xz。 也 就 是 说 ， 当 i 启 得 拍卖 时 ， 他 支付 的 是 一 个 关键 报价 ， 即 他 能 够 赢得 物品 的 最 
小 报价 (假设 其 他 竞拍 者 的 报价 b-; 固 定 )。 这 和 我 们 所 熟悉 的 单 物品 二 价 拍卖 中 的 支 
付 规则 是 类 似 的 。 


4. 1.4 福利 最 大 化 的 计算 困难 性 


那么 ，4. 1. 2 节 中 提出 的 机 制 是 否 是 理想 化 的 呢 ? 理想 化 意味 着 : 
(1) 是 DSIC 的 。 
(2) 假设 报价 都 是 真实 的 ,能够 最 大 化 社会 福利 。 





O 背包 问题 的 一 个 实例 是 由 2n 十 1 个 正 数 来 进行 定义 的 : 物品 的 价值 wj ，…，w， 物 品 的 大 小 wh ，…， 
wn， 以 及 背包 容量 W。 问 题 的 目标 是 计算 出 物品 的 一 个 子 集 ， 使 得 物品 的 总 大 小 不 超过 W 的 前 提 
下 ， 其 总 价值 最 高 。 
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(3) 可 以 在 输入 量 的 多 项 式 时 间 内 (实际 上 是 线性 时 间 ) 实 施 。 输 入 量 是 指 描述 所 
有 相关 参数 (包括 报价 、 规 模 、 容 量 ) 所 需要 的 比特 位 的 数量 。8 

答案 是 否定 的 。 原 因 是 背包 问题 是 WP 困难 问题 。 这 意味 着 ， 除 非 P= 二 NPS， 
否则 公式 (4. 1) 中 的 分 配 规则 不 能 在 多 项 式 时 间 内 被 实现 。 所 以 ， 以 上 性 质 中 (2) 和 
《3) 是 不 兼容 的 。 

既然 并 不 存在 理想 化 的 背包 拍卖 ， 那 么 我 们 不 得 不 进行 妥协 ， 即 在 三 个 目标 中 至 
少 放 松 一 个 。 但 是 该 放松 哪 一 个 呢 ? 首先 ， 注意 如 果 放 松 DSIC 这 一 条 件 ， 并 不 会 有 
任何 作用 ， 因 为 是 (2) 和 (3) 产 生 的 冲突 。 

一 个 明智 的 选择 是 放松 第 三 个 限制 , 但 是 本 书 不 会 花 太 多 时 间 去 讲解 这 种 方法 。 
放松 第 三 个 限制 尤其 适合 于 背包 拍卖 ， 因 为 我 们 可 以 利用 动态 规划 在 伪 多 项 式 时 间 内 
算出 分 配 规则 (4. 1)s®。 在 机 制 设 计 里 ， 如 果 你 处 理 的 情境 很 小 或 者 体系 结构 清晰 ， 
并 且 有 充足 的 时 间 和 强大 的 计算 能 力 ， 当 然 可 以 这 样 来 实现 社会 福利 的 最 优化 。 这 样 
得 到 的 分 配 规则 结果 是 单调 的 ， 并 且 可 以 扩展 到 DSIC 机 制 ( 见 练习 4.1.8 

在 本 章 后 续 部 分 ， 我 们 将 会 探讨 如 何在 第 二 个 目标 上 进行 妥协 ， 即 使 用 近似 最 优 
的 福利 最 大 化 换取 计算 的 高 效 性 ， 并 同时 保证 DSIC。 


4.2 算法 机 制 设 计 


算法 机 制 设 计 是 算法 博弈 论 中 最 早 的 ， 也 是 最 完善 的 一 个 分 支 。 本 节 将 展示 这 个 
领域 里 一 个 代表 性 的 结果 。 

算法 机 制 设 计 的 主导 模式 是 : 放松 理想 化 拍卖 的 第 二 个 要 求 ( 即 社会 福利 最 大 
化 )， 放 松 的 程度 越 小 越 好 ， 同 时 受到 第 一 个 (DSIC) 和 第 三 个 (多 项 式 时 间 ) 要 求 的 约 
束 。 对 于 单 参 数 环境 ， 迈 尔 森 引 理 ( 定 理 3.7) 可 以 将 这 个 任务 约 简 为 设计 一 个 多 项 式 
时 间 的 单调 分 配 规则 ， 并 要 求 该 分 配 使 社会 福利 尽 可 能 趋 近 最 大 化 。 


4.2.1 最 好 的 情况 : 免费 的 DSIC 
算法 机 制 设 计 能 在 过 去 15 年 获得 巨大 进展 的 一 个 原因 就 是 ， 它 与 近似 算法 这 一 
成 熟 的 学 科 有 着 紧密 的 联系 。 近 似 算法 的 主要 目标 是 ， 为 NP 困难 的 优化 问题 设计 多 





O 更 确切 地 讲 ， 机 制 关 于 输入 量 s 的 运行 时 间 应 该 最 多 是 cy“， 其 中 5 Ald 是 常数 ， 且 与 无关。 

OQ 吕 和 NP 问题 分 别 表示 在 多 项 式 时 间 内 可 以 求解 的 问题 的 集合 ， 以 及 给 定 一 个 正确 解 ， 在 多 项 时 间 内 
可 以 验证 该 解 的 问题 的 集合 。AP 集合 只 会 比 刀 集合 更 大 。P 天 NP 尚未 被 证 明 ， 但 却 是 一 个 被 普遍 
接受 的 猜想 。 

O 也 就 是 说 ， 如 果 报 价 或 者 规模 只 需要 用 很 少量 的 比特 就 可 以 表示 ， 那 么 该 问题 就 可 以 被 很 快 求解 。 
可 以 参考 本 科 的 算法 教材 。 

O ”要 记得 支付 也 是 需要 计算 的 。 一 般 来 说 ， 支 付 的 计算 需要 求解 4 个 福利 最 大 化 的 问题 (针对 每 个 智能 
体 求解 一 个 问题 )。 见 练习 4. 3。 
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项 式 时 间 的 算法 ， 以 求 尽 可 能 接近 最 优 。 除 了 算法 要 满足 单调 性 这 一 限制 ， 算 法 机 制 
设计 的 目的 和 近似 算法 完全 相似 。 由 于 机 制 设 计 中 关于 动机 的 限制 条 件 被 干净 利落 地 
整合 进 分 配 规则 的 附加 条 件 中 ， 所以， 算法 机 制 设计 实际 上 是 通过 “奇妙 的 计算 模 
型 ”而 归 约 到 了 算法 设计 问题 。 

多 项 式 时 间 的 DSIC 机 制 的 设计 空间 只 会 比 多 项 式 近 似 算法 的 设计 空间 更 小 。 最 
好 的 情况 就 是 ， 除 了 多 项 时 间 这 一 要 求 导致 的 福利 损失 之 外 ，DSIC( 或 者 单调 性 ) 的 
限制 条 件 并 不 会 带 来 更 多 的 福利 的 损失 。 我 们 知道 ， 社 会 福利 最 大 化 这 一 目标 自然 而 
然 产 生 了 单调 的 分 配 规则 ， 那 是 否 近 似 社 会 福利 最 大 化 也 是 这 样 的 呢 ? 


4.2.2 再 谈 背 包 拍卖 


为 了 更 加 规范 化 地 讨论 我 们 提出 的 问题 ， 现 在 回 到 背包 拍卖 上 来 。 对 于 背包 问 
题 ， 有 一 些 启发 式 算法 能 保证 有 很 好 的 最 坏 情况 表现 。 例 如 ， 考 虑 下 面 这 样 的 分 配 规 
W: 给 定 报价 集合 上 ， 通 过 一 个 简单 的 贪心 算法 来 决定 一 个 赢家 集合 S， 这 个 集合 的 
总 规模 是 >， wo BRREW, Arie >W 的 那些 竞拍 者 i 移 除 并 不 会 造成 影响 ， 


所 以 我 们 假设 对 于 所 有 的 i 都 有 w; 夺 W。 





背包 问题 的 贪心 算法 
1. 将 竞拍 者 按照 以 下 公式 的 顺序 从 高 到 低 排序 : 


by be 


n 
= => eee = = 
wi wz Wn 


2. 按照 这 个 顺序 依次 选取 赢家 ， 直 到 背包 剩余 容量 容纳 不 下 新 的 竞拍 者 的 规模 ， 
算法 停止 。S 

3. 要 么 返回 上 一 步 中 的 解 ， 要 么 直接 返回 最 高 报价 者 。 判 断 方法 是 ， 对 比 这 两 者 
的 社会 福利 值 ， 哪 个 更 大 就 返回 哪个 。S 








这 个 贪心 算法 是 背包 问题 的 一 个 1/2 近似 算法 ， 也 就 是 说 ， 对 于 任意 一 个 背包 问 
这 个 算法 所 返回 的 解 的 值 至 少 是 最 优 解 的 一 半 。 我 们 有 如 下 的 定理 。 
定理 4. 2( 背 包 拍 卖 的 近似 保证 ) 如 果 竞价 都 是 真实 的 ， 那 么 使 用 贪心 算法 进行 


六 


O 直观 上 来 讲 ， 高 的 报价 和 小 的 规模 会 使 得 竞拍 者 更 有 竞争 力 。 这 种 启发 式 的 排序 方法 是 对 这 两 个 属 
性 进行 了 权衡 ， 即 考虑 “对 单位 规模 的 估 值 ”。 

O 或 者 ,继续 按照 排序 的 顺序 ， 将 不 等 式 中 后 续 其 他 能 被 容 下 的 竞拍 者 再 加 进 背 包 。 这 种 改进 的 启发 
式 排序 方法 只 会 比 原始 的 启发 式 方法 更 好 。 

上 利 ” 这 一 步 的 动机 是 ， 如 果 有 一 个 值 非常 高 但 规模 也 很 大 的 竞拍 者 ， 第 二 步 产 生 的 解 可 能 是 高 度 次 优 的 。 
作为 替代 ， 这 个 步骤 也 可 以 按 非 递 减 的 竞拍 顺序 对 竞拍 人 进行 排序 ， 并 贪心 地 将 多 个 竞拍 者 打包 ， 
而 不 是 只 考虑 报价 最 高 的 竞拍 者 。 这 种 方法 会 有 更 好 的 表现 。 
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分 配 下 的 社会 福利 至 少 是 最 大 社会 福利 的 50%。 

简要 证 明 : 假设 有 真实 的 报价 妇 ，…，w,， 已 知 的 各 个 竞拍 者 的 规模 ew， 
w,， 以 及 总 容量 W。 假 设 我 们 可 以 对 某 一 个 竞拍 者 只 选取 他 的 一 部 分 规模 ， 估 值 也 
按 百 分 比分 扒 。 例 如， 如 果 一 个 佑 值 为 10 的 竞拍 者 被 选取 了 70% 的 容量， 那么 他 对 
于 社会 福利 的 贡献 就 是 7。 下 面 是 这 种 “部 分 背包 ”的 一 个 贪心 算法 : 按照 上 面 步 
又 1 中 的 方法 对 竞拍 者 排序 ， 选 取 启 家 直至 总 容量 被 填 满 ( 最 后 一 个 该 家 按 需 要 的 比 
例 选 取 )。 通 过 简单 的 交换 论点 引 的 方法 可 以 证 明 ， 这 个 算法 可 以 将 部 分 背包 拍卖 问 
题 的 社会 福利 最 大 化 。 

假设 在 部 分 背包 拍卖 的 最 优 解 中 ， 排 名 前 & 的 竞拍 者 被 完全 选取 ， 排 名 & 十 1 的 
竞拍 者 被 选取 了 一 部 分 。 男 外 ， 以 上 普通 背包 拍卖 算法 的 (1)、(2) 步 所 实现 的 解 实际 
上 就 是 前 个 竞拍 者 的 估 值 之 和 。 而 第 (3) 步 中 如 果 返 回 的 是 最 高 报价 者 ， 则 他 的 估 
值 是 一 定 大 于 等 于 排名 第 十 1 的 竞拍 者 的 估 值 的 一 部 分 的 。 算 法 的 第 (3) 步 可 能 返回 
两 种 解 ， 而 每 种 都 至 少 是 “部 分 背包 ”问题 的 最 优 解 的 一 半 。 m 

上 面 这 种 贪心 分 配 算法 也 是 单调 的 (练习 4.5)， 使 用 迈 尔 森 引 理 (定理 3.7)， R 
们 可 以 将 其 扩充 为 一 个 DSIC 的 机 制 。 这 个 机 制 在 多 项 式 时 间 内 能 运行 完毕 。 并 且 ， 
如 果 报 价 是 真实 的 ， 其 社会 福利 至 少 是 最 大 值 的 50%。 

看 到 这 样 的 结果 ， 你 可 能 会 觉得 非常 乐观 ， 会 认为 每 一 个 合理 的 分 配 规则 都 是 单 
调 的 。 目 前 为 止 ， 我 们 只 讨论 过 一 个 非 单调 的 分 配 规 则 ， ei “第 二 高 
竞价 者 赢 ”(3. 3 节 ) ， 而 我 们 却 并 未 对 其 有 所 在 意 。 但 是 ， 要 注意 的 是 : 








注意 
自然 的 分 配 规则 并 不 都 是 单调 的 。 





例如 ， 针 对 背包 问题 ， 对 于 所 有 的 :二 0， 都 存在 一 种 (1 一 e) 近 似 算法 ， 该 算法 的 
运行 时 间 是 输入 参数 和 1/e 的 多 项 式 时 间 级 的 ， 这 样 的 算法 即 是 一 个 完全 多 项 式 时 间 
近似 方案 (FPTAS)( 见 问题 4. 2)。 如 果 要 直接 实施 这 个 算法 ， 其 所 带 来 的 分 配 规则 并 
不 是 单调 的 ,虽然 可 以 对 该 算法 进行 调整 ， 在 不 损害 近似 保证 的 前 提 下 来 恢复 分 配 的 
单调 性 ( 见 问题 4. 2) 。 这 就 是 算法 机 制 设计 的 特点 : 对 于 一 个 NP 困难 的 优化 问题 ， 
首先 检查 是 否 可 以 依靠 最 先进 的 近似 算法 直接 实现 DSIC 机 制 。 如 果 不 行 ， 就 将 这 个 





O 有些 关于 算法 的 教材 将 其 称 为 “分 数 背 包 ”， 英 文 为 fractional knapsack problem。 一 一 译 者 注 

© ”交换 论点 的 英文 为 exchange argument， 也 译 为 交换 参数 或 交换 步骤 。 请 参见 关于 算法 的 其 他 教 
材 。 一 一 译 者 注 

如” 如果 还 有 额外 的 假设 , 贪心 分 配 算法 的 表现 还 会 更 好 。 例 如， 如 果 对 于 所 有 竞拍 者 i 都 甩 ; 志 aW， 


Hae (0, =|. 那么 即便 不 使 用 算法 的 第 (3) 步 ， 近似 解 的 保证 都 可 以 提升 到 1 一 a。 
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问题 进行 调整 ， 或 者 设计 一 种 新 的 近似 算法 ， 并 尽量 保证 这 种 新 的 算法 仍然 满足 近似 


4.3 显示 原理 


4.3.1 Bix DSIC 


到 目前 为 止 ， 我 们 探讨 的 机 制 设计 理论 只 涉及 了 DSIC 机 制 。 我 们 不 断 地 强调 追 
求 DSIC 性 质 的 原因 。 首 先 ， 对 于 参与 者 而 言 ， 在 DSIC 机 制 中 很 容易 得 出 该 做 什么 : 
只 需要 选取 占 优 策略 并 如 实 披露 自己 的 私人 信息 即 可 。 其 次 ， 机 制 设计 者 可 以 预测 机 
制 的 结果 是 怎样 的 ， 需 要 的 假设 仅仅 是 参与 者 都 会 执行 占 优 策 略 ， 而 这 一 行为 假设 并 
不 算 强 。 但 是 ， 一 价 拍卖 等 非 DSIC 的 机 制 在 实际 中 仍然 是 很 重要 的 。 

那么 ， 非 DSIC 的 机 制 是 否 能 完成 DSIC 机 制 不 能 做 的 事情 呢 ? 为 了 解答 这 个 问 
题 ， 我 们 需要 梳理 构成 DSIC 的 两 个 条 件 。 





DSIC 的 条 件 
D 对 于 每 一 个 估 值 组 合 ， 机 制 都 有 一 个 占 优 策略 均衡 ， 即 所 有 参与 者 都 选择 占 
优 策略 时 所 进入 的 博弈 局 势 。 
(2) 在 占 优 策略 均衡 中 ， 每 个 参与 者 都 向 机 制 如 实 汇 报 自己 的 私人 信息 。 








有 些 机 制 满足 (1) 但 不 满足 (2)。 例 如 ， 在 一 个 单 物品 拍卖 中 ， 报 价 组 合 为 ,但 
是 卖家 使 用 2b 这 个 向 量 来 做 一 次 维 克 里 拍卖 。 在 这 种 情况 下 ， 苋 拍 者 的 占 优 策略 就 
是 汇报 自己 真实 估 值 的 一 半 。 


4.3.2 直接 显示 的 证 明 


显示 原理 说 的 是 ， 如 果 条 件 (1) 已 满足 ， 那 条 件 (2) 就 可 以 满足 。 

定理 4.3(DSIC 机 制 的 显示 原理 ) 如 果 机 制 M 中 每 个 参与 者 都 有 一 个 占 优 策略 ， 
那 一 定 存 在 和 这 个 机 制 相 等 价 的 DSIC 的 直接 显示 机 制 M 。 

这 里 “等 价 ” 的 意思 是 ,对 于 任意 一 个 估 值 组 合 ， 直 接 显示 机 制 M 的 结果 ( 即 拍 
卖 中 的 赢家 和 其 需要 支付 的 价格 ) 都 和 机 制 M 下 智能 体 选择 占 优 策略 时 的 结果 相同 。 

证 明 : 见 图 4.2。 假 设 对 于 每 一 个 竞拍 者 i. 其 私人 信息 是 v;， 他 在 给 定 机 制 M 
中 的 占 优 策略 是 函数 ;; (vw;)。 现 在 我 们 构建 一 个 机 制 M 。 假 设 参 与 者 委托 M' 选 出 自 
己 的 占 优 策略 。 则 机 制 M' 将 从 各 个 智能 体 接收 输入 bH，…，b,。 它 会 产生 输出 
51(051)，…，5,(b,)， 并 提交 给 机 制 M。 机 制 M 完全 复制 与 机 制 M 相同 的 输出 。 

机 制 M' 是 DSIC 的 : 参与 者 i 的 真实 私人 信息 是 vw， 那么 他 如 果 汇 报 一 个 非 v 
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的 信息 ， 将 会 使 得 机 制 M' 产 生 其 他 策略 而 不 是 占 优 策略 %(uw)， 而 这 个 非 占 优 的 策 
略 输入 进 M 后， 会 使 参与 者 i 的 收 
益 降低 。 a 
定理 4. 3 的 关键 在 于 ， 至 少 在 

原理 上 ， 如 果 你 想 要 设计 一 个 含有 
占 优 策略 的 机 制 ， 那 么 你 也 可 以 设 
计 另 外 一 个 机 制 ， 在 这 个 另外 的 机 了 
制 中 ， 直 接 显示 (在 拍卖 中 ， 即 如 实 图 4.2 显示 原理 的 证 明 。 给 定 一 个 机 制 M 和 其 下 
汇报 自己 的 佑 值 ) 是 一 个 占 优 策略 。 的 占 优 策略 ， 构 建 一 个 直接 显示 机 制 M 

“如 实 汇报 信息 ”本 身 并 不 是 难点 ; DSIC 机 制 设计 的 困难 在 于 ， 想 要 的 博弈 局 势 应 该 
是 一 个 占 优 策略 均衡 。 














4.3.3 在 占 优 策略 均衡 之 外 


我 们 是 否 可 以 将 4. 3. 1 节 中 的 条 件 (1) 放 松 ， 从 而 得 到 更 好 的 机 制 呢 ? 这 个 想法 
带 来 的 首要 问题 就 是 ， 当 智能 体 没 有 占 优 策略 时 ， 我 们 需要 对 其 行为 做 更 强 的 假设 ， 
以 便 预 测 智能 体 将 要 做 什么 ， 以 及 机 制 的 结果 将 会 是 什么 。 例 如 ， 我 们 可 以 基于 参与 
者 私人 信息 之 上 的 公共 先 验 知识 ,来 考虑 贝 叶 斯 -纳什 均衡 (问题 5. 3)， 或 者 完全 信 
息 下 的 纳什 均衡 (与 问题 3. 1 类似 )。 如 果 我 们 能 够 做 这 样 的 假设 ， 是否 可 以 得 到 比 
DSIC 机 制 更 好 的 机 制 呢 ? 

答案 是 “有 时 是 可 以 的 ”。 由 于 这 个 原因 ， 也 由 于 非 DSIC 机 制 在 实际 中 很 常见 ， 
设计 非 DSIC 的 机 制 是 很 重要 的 一 个 任务 。 问 题 5. 3 简单 提 及 了 这 个 理论 。 一 个 粗糙 
的 经 验 法 则 是 ， 对 于 那些 足够 简单 的 问题 ， 比 如 我 们 到 目前 所 学 过 的 那些 问题 ， 非 
DSIC 机 制 能 做 的 那些 事 ，DSIC 机 制 同样 能 做 。 然 而 ， 在 更 加 复杂 的 问题 中 ， 将 
DSIC 的 限制 放松 常常 能 让 机 制 设计 者 获得 更 好 的 性 能 保障 。 而 可 以 证 明 的 是 ， 这 样 
的 性 能 是 DSIC 机 制 所 不 能 做 到 的 。 在 这 样 的 环境 设 定 下 ，DSIC 机 制 和 非 DSIC 机 制 
是 无 法 比较 的 。DSIC 机 制 实现 了 强 动机 保障 ， 而 非 DSIC 机 制 则 有 更 好 的 性 能 表现 。 
这 两 者 哪 一 个 更 重要 ?” 这 取决 于 具体 的 应 用 环境 。 


总 结 


© 背包 拍卖 是 对 受 限 、 共 享 的 资源 进行 分 配 问题 的 建 模 。 竞 拍 者 有 私人 估 值 和 
公开 的 规模 。 在 一 个 可 行 的 拍卖 结果 中 ， 所 有 赢家 的 规模 之 和 应 该 不 超过 资 
源 的 总 容量 。 

e 背包 拍卖 中 的 最 大 化 社会 福利 的 计算 是 一 个 NP 困难 问题 。 所 以 ， 如 果 PA 
NP， 就 不 存在 理想 化 的 背包 拍卖 。 
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o 算法 机 制 设计 的 目标 是 将 理想 化 拍卖 中 的 第 二 个 要 求 ( 社 会 福利 最 大 化 ) 尽 可 
能 少 的 放松 ， 同 时 满足 第 一 个 (DSIC) 和 第 三 个 (多 项 式 时 间 ) 的 要 求 。 在 最 好 
的 情况 下 ， 存 在 一 个 多 项 式 时 间 的 DSIC 机 制 。 这 个 机 制 对 于 近似 社会 福利 的 
保证 对 应 于 最 先进 的 多 项 式 时 间 近 似 算 法 。 

o 针对 福利 最 大 化 问题 ， 最 先进 的 近似 算法 也 许 能 产生 出 单调 的 分 配 规则 ， 也 
许 不 能 。 

e 显示 原理 告诉 我 们 ， 对 于 每 一 个 含有 占 优 策略 均衡 的 机 制 ， 都 存在 一 个 与 它 
等 价 的 、 直 接 显示 是 占 优 策略 均衡 的 机 制 。 

o 在 许多 复杂 的 机 制 设 计 问 题 中 ， 非 DSIC 机 制 可 以 实现 DSIC 机 制 所 实现 不 了 
的 性 能 。 


说 明 


算法 机 制 设计 的 起 源 参 见 Nisan 和 Ronen(2001)、Lehmann 等 (2002); 近期 的 综 
述 见 Nisan(2015)。Archer 和 Tardos (2001) 调 查 了 单 参数 环境 。Mu Alem 和 Nisan 
(2008) 提 出 了 尼 包 拍卖 。Gibbard(1973) 规 范 化 地 提出 了 显示 原理 。Garey 和 Jahnson 
(1979) 给 出 了 关于 NP 完全 性 的 很 好 的 解释 。 

问题 4. 1 和 Chekuri 和 Gamzu(2009) 相 关 。 经 典 的 关于 背包 问题 的 FPTAS XA 
F Ibarra 和 Kim(1975) 。 更 多 细节 及 前 沿 的 多 项 式 时 间 近 似 算 法 参考 Vazirani(2001) 
和 Williamson 和 Shmoys(2010) 。 问 题 4. 2 RAF Briest 等 (2005)。 问 题 4. 3 RAF 
Lehmann 等 (2002) 。 


练习 


练习 4. 1 考虑 任意 一 个 单 参数 环境 ， 以 及 可 行 的 分 配 集合 X。 证 明 福 利 最 大 化 的 分 配 规则 
x(b) = argmax, 5 bi x; (4. 2) 

是 单调 的 (定义 3. 6)。 
[假设 如 果 出 现 平 局 ， 该 平局 可 以 通过 确定 性 且 兼 容 的 方法 打破 ， 例如 使 
用 字典 排序 等 。] 

练习 4.2 ”继续 上 一 个 练习 题 。 将 X 限定 为 0-1 向 量 ， 即 每 一 个 竞拍 者 要 么 赢得 物品 
要 么 失去 物品 。 假 设 对 于 每 一 个 竞拍 者 i， 都 存在 一 个 博弈 局 势 ， 在 此 局 
势 下 竞拍 者 没有 赢得 物品 。 迈 尔 森 支付 公式 (3. 5) 规 定 ， 一 个 赢家 将 支付 
他 的 “关键 报价 ”， 即 他 能 够 赢得 物品 的 最 小 报价 。 
证 明 ， 如 果 在 分 配 规则 (4. 2) FS 是 赢家 集合 并 且 i€ S"， 那 么 i 的 关键 
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练习 4.3 


练习 4.4 
练习 4.5 
练习 4.6 


练习 4.7 


问题 


问题 4. 1 


报价 等 于 以 下 两 项 的 差 : (1) 不 包含 ;的 可 行 分 配 集合 的 最 大 社会 福利 。 
(QS 中 除去 i 后 的 剩余 社会 福利 D wv。 
JES” NI 

[在 这 种 情况 下 ， 每 一 个 赢家 的 支付 都 是 他 的 “外 部 性 ”， 即 他 的 出 现 对 于 

其 他 竞拍 者 带 来 的 损失 。] 

继续 上 一 道 练 习题 。 将 X 限定 为 0-1 向 量 ， 且 是 单 参数 环境 。 假 设 你 有 一 

子 程序 ， 即 给 定 报 价 组 合 bp， 计 算 福利 最 大 化 的 分 配 规则 (4. 2) 的 结果 。 

(a) 解释 如 何 通过 调用 以 上 子 程序 n 十 1 次 实现 福利 最 大 化 的 DSIC 机 制 ， 
其 中 是 参与 者 数量 。 

(b) 求证 :如果 在 某 些 单 参数 环境 下 ,福利 最 大 化 问题 (给 定 b 作为 输入 ， 
计算 规则 (4. 2)) 可 以 在 多 项 式 时 间 内 被 解决 ， 则 在 这 样 的 环境 下 ， 存 
在 如 定理 2.4 所 述 的 理想 化 的 机 制 。 

求证 : 定理 4.2 的 证 明 中 的 贪心 算法 总 能 得 到 部 分 背包 问题 的 一 个 最 优 解 。 

求证 : 在 4.2.2 节 中 出 现 的 三 步 的 贪心 背包 拍卖 算法 是 单调 的 。 

考虑 一 个 背包 拍卖 的 变种 ， 有 两 个 背包 ， 最 大 容量 分 别 是 Wi, 和 W,。 假 设 

竞拍 者 被 划分 成 两 部 分 S; 和 S, ， 且 对 于 ) 一 1，2 有 gus <W,. 。 假 设 分 


配 规则 是 这 样 的 : 先 用 4. 2. 2 节 中 的 分 配 规 则 填充 第 一 个 背包 ， 然 后 再 将 
同样 的 分 配 规则 实施 在 剩余 的 竞拍 者 上 ， 填充 第 二 个 背包 。 这 样 的 分 配 规 
则 是 否 是 单调 的 ? 如 果 是 ， 给 出 证 明 ， 如 果 不 是 ， 给 出 明确 的 反例 。 

CH) 显示 原理 告诉 我 们 DSIC 的 直接 显示 机 制 可 以 模拟 其 他 任何 基于 占 优 
策略 均衡 的 机 制 。 试 着 从 现实 应 用 的 角度 对 显示 原理 进行 批评 。 提 出 一 人 
具体 的 情境 ， 在 此 情境 下 ， 相 较 DSIC 机 制 ， 你 会 更 倾向 使 用 非 直接 显示 
机 制 ， 并 解释 你 的 推理 缘由 。 


考虑 背包 拍卖 的 一 个 变种 。 在 这 个 拍卖 里 ， 每 一 个 竞拍 者 i 的 估 值 w; 和 规 
模 w, 都 是 私有 信息 。 现 在 机 制 接受 的 信息 是 竞价 组 合 b 和 所 有 竞拍 者 报告 
的 容量 组 合 a。 分 配 规 则 x(b，a) 是 一 个 竞价 组 合 和 规模 组 合 的 函数 ， 它 
决定 了 分 配给 每 一 个 竞拍 者 的 容量 大 小 。 分 配 规则 的 可 行 性 要 求 ， 对 每 一 


对 b 和 a 都 有 >) xi(b,a) 三 W ， 其 中 W 是 共享 资源 的 最 大 容量 。 定 义 竞 


He i 的 效用 为 如果 他 获得 了 物品 ( 即 x;(b,， a) >w), WA v p: Cb, 
a)， 否 则 其 效用 记 为 一 p;(b，a)。 这 样 的 拍卖 并 不 是 一 个 单 参数 环境 。 
考虑 如 下 的 机 制 。 给 定 b 和 报告 的 a， 机 制 使 用 a 的 值 运 行 4. 2. 2 节 中 的 
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问题 4. 2 


问题 4. 3 





RAE AIL. ， 获 得 赢家 集合 和 售 价 p。 机 制 给 每 一 个 赢家 分 配 的 容量 等 
于 他 所 汇报 的 容量 大 小 a;， 收 取 的 价格 为 bp;; 输家 不 获得 资源 ， 支 付 为 0。 
这 个 机 制 是 否 是 DSIC 的 ? 证 明 或 给 出 反例 。 

在 4. 2. 2 节 中 我 们 为 背包 拍卖 给 出 了 一 个 分 配 规则 ， 该 规则 是 单调 的 ， 保 

证 有 最 大 社会 福利 的 50% 的 福利 ， 并 且 运 行 在 多 项 式 时 间 内 。 你 能 设计 一 

个 比 这 更 好 的 机 制 吗 ? 

我 们 首先 描述 一 个 经 典 的 完全 多 项 式 时 间 近 似 算 法 (FPTAS) 。 问 题 的 输入 

是 估 值 如 ，…，%,， 规 模 tw; ，…，ww,， 以 及 最 大 容量 W。 给 定 用 户 指 定 的 

参数 :二 0， 我 们 考虑 如 下 的 算法 .4A.; m 是 一 个 参数 ， 我 们 将 在 后 文 对 其 进 

行 讨论 。 

将 每 一 个 wv 求 近似 ， 使 其 值 距离 m 的 倍数 最 近 ， 记 为 。 

将 各 个 v' 除 以 mx， 得 到 宁 ，…，V,， 使 用 伪 多 项 式 时 间 算 法 计算 最 优 解 。 

[你 可 以 假设 存在 这 样 一 个 运行 时 间 是 wn 和 max 5 的 多 项 式 级 的 算法 。] 

(a) 证 明 : 如 果 我 们 设置 参数 m H e (maxv;)/n, 然后 运行 算法 4 已， 那么 
该 算法 的 运行 时 间 是 nn 和 1/e 的 多 项 式 级 的 (与 各 个 也 无 关 ) 。 

Cb) (HEH: 如 果 我 们 设置 参数 六 为 e(maxw)/n， 然 后 运行 算法 和 4， 那 
么 该 算法 将 会 输出 一 个 解 ， 且 这 个 解 至 少 是 最 优 解 的 1 一 e 倍 。 

Cc) 证 明 : 如 果 我 们 设置 参数 为 与 每 一 个 vi 都 无 关 的 常数 ， 然 后 运行 算法 
.4.， 那 么 该 算法 将 产生 单调 的 分 配 规则 。 

Cd) WEH: 如 果 我 们 按照 (a) 和 (b) 来 设置 参数 ， 然 后 运行 算法 .4.， 那 么 算 
法 不 一 定 产 生 单调 的 分 配 规 则 。 

(e) (H) 为 背包 拍卖 给 出 一 个 DSIC 的 机 制 ， 使 该 机 制 在 用 户 指定 的 参数 e 
和 真实 的 竞价 下 ， 其 输出 的 社会 福利 至 少 是 最 大 社会 福利 的 1 一 s 倍 ， 
并 且 其 运行 时 间 是 ”和 1 /e 的 多 项 式 级 的 。 

考虑 有 M 个 不 同 的 物品 。 一 共有 nn 个 竞拍 者 ， 每 一 个 竞拍 者 i 对 物品 都 有 一 

个 公开 的 需求 集 T,SM， 以 及 对 得 到 这 些 所 需 物 品 的 私人 估 值 w。 如 果 竞 拍 

者 以 总 价 p 获得 一 个 集合 S; 的 物品 ， 那 他 的 效用 计算 为 vz; 一 p， 其 中 ， 当 

5; 二 TT 时 zj 二 1， 否 则 zi 二 0。 这 是 一 个 单 参数 环境 。 由 于 每 一 个 物品 都 只 能 

被 分 配给 一 个 竞拍 者 ， 一 个 竞拍 者 子 集 W 中 所 有 人 都 同时 可 以 获得 他 所 需 

的 物品 集 ， 当 且 仅 当 对 于 每 两 个 不 同 的 i，jEW， BATT, =O. 

(a) (HER: 给 定 所 有 ww 和 所 有 T,, 计算 社会 福利 最 大 化 的 问题 是 NP 
困难 的 。 

Cb) 给 定 竞 价 组 合 bp， 有 一 个 解决 社会 福利 最 大 化 的 贪心 算法 。 














= 一 
初始 化 三 一作 和 X 一 M 
对 竞拍 者 进行 排序 ， 从 而 使 得 b 宇 bs 宇 … 宇 bb， 
for i=l, 2, 3, **, ndo 
if T,CX then 
BTM X PER., 并 将 i 添加 到 WW 
输出 赢家 集合 WW | 








这 个 算法 是 否 给 出 了 一 个 单调 的 分 配 规 则 ? 给 出 证 明 或 反例 。 

(c) (HIE: 如 果 每 一 个 竞拍 者 i 都 如 实 报价 ， 并 且 7T; 的 势 最 多 是 4， 则 
(b) 中 的 分 配 规则 所 导致 的 结果 的 社会 福利 至 少 是 最 大 社会 福利 的 
1/d, 
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第 2 一 4 章 关 注 的 是 以 下 机 制 : 它 能 够 精确 或 近似 最 大 化 社会 福利 。 在 这 类 机 制 
中 ， 收 益 仅仅 是 一 种 “副产品 ”>， 目 的 是 激励 智能 体 真 实 上 报 他 们 的 私人 信息 。 本 章 
研究 的 是 那些 尽量 提高 收益 的 机 制 ， 这 类 机 制 的 特点 是 能 够 使 期 望 收益 最 大 化 ， 其 中 
期 望 是 基于 智能 体 的 估 值 分 布 计算 得 到 的 。 

5. 1 节 解 释 了 为 什么 最 大 化 收益 要 比 最 大 化 福利 困难 ， 同 时 引入 了 贝 叶 斯 情境 。 
5. 2 节 是 本 章 的 核心 ， 揭 示 了 收益 最 大 化 机 制 其 实 就 是 “虚拟 福利 ”最 大 化 机 制 。 
5. 3 节 展 示 了 以 上 理论 是 如 何 增加 雅虎 关键 字 搜 索 拍 卖 的 收益 的 。5. 4 节 证 明了 一 个 
在 5. 2 节 用 到 的 技术 性 引 理 。 


5.1 收益 最 大 化 的 挑战 


5. 1.1 我 们 被 社会 福利 最 大 化 “ 宠 坏 ” 了 


我 们 有 很 多 理由 把 最 大 化 社会 福利 当 作 机 制 设计 的 研究 目标 。 第 一 个 理由 是 ， 这 
个 目标 和 许多 现实 世界 场景 息息相关 。 比 如 ， 在 政府 拍卖 (例如 频谱 拍卖 ， 详 见 第 8 
章 ) 中 ,首要 目标 就 是 要 最 大 化 社会 福利 。 在 这 类 拍卖 中 ， 收 益 的 确 也 是 一 个 考虑 因 
素 ， 但 通常 不 是 首要 因素 。 除 此 之 外 ,在 竞争 性 市 场 中 ， 从 经 验 上 来 讲 ， 卖 家 也 应 该 
关注 如 何 最 大 化 社会 福利 ， 否 则 那些 关注 最 大 化 社会 福利 的 竞争 者 卖家 就 会 “ 偷 走 ” 
原本 属于 你 的 客户 。 

以 最 大 化 社会 福利 开始 研究 机 制 设 计 的 第 二 个 理由 与 教学 相关 : 社会 福利 很 特 
殊 。 特 殊 之 处 在 于 : 任何 单 参数 环境 都 存在 一 个 满足 DSIC 的 机 制 ， 使 得 在 智能 体 都 
真实 竞价 的 情况 下 ， 对 于 任意 私人 估 值 组 合 都 可 以 得 到 一 个 社会 福利 最 大 化 的 结果 
(参考 练习 4. 1)8 。 这 样 的 机 制 对 社会 福利 的 优化 效果 就 如 同 私有 信息 被 事先 知道 了 
一 样 (满足 DSIC 不 需 任何 代价 ) 。 而 这 种 令 人 惊叹 的 强大 性 能 保证 (也 被 称 为 “事后 
保证 ”) 是 其 他 目标 函数 所 不 能 实现 的 。 





日 ”这 个 性 质 其 至 在 更 广泛 的 范围 上 都 成 立 ， 见 第 7 章 。 








5.1.2 单 竞拍 者 和 单 物 品 


接 下 来 的 小 例子 是 用 来 启发 思路 的 。 假 设 只 拍卖 一 个 物品 ， 同 时 只 有 一 个 私人 佑 
值 为 wv 的 竞拍 者 。 当 只 有 一 个 竞拍 者 时 ,满足 DSIC 的 直接 拍卖 机 制 的 空间 很 小 : 就 
只 有 一 个 精确 的 牌价 ， 即 “要 么 买 要 么 走 ”° 。 当 牌价 7 三 0 时 ， 拍 卖 的 收益 要 么 是 > 
( 当 vr 时 )， 要 么 是 0( 当 wr 时)。 

在 这 种 设 定 下 ， 最 大 化 社会 福利 很 简单 : 设置 ”一 0 使 得 这 次 拍卖 免费 将 物品 分 
配给 竞拍 者 。 注 意 ， 这 个 最 优 牌 价 独 立 于 竞拍 者 的 私人 估 值 vo 

那 假如 现在 要 最 大 化 卖家 收益 了， 又 该 怎样 设置 + WE? 如果 我 们 能 够 通过 “ 心 
灵感 应 ”知道 竞拍 者 的 私人 估 值 v， 那么 我 们 就 应 该 设置 -二 vw。 但 v 是 竞拍 者 的 
私人 信息 ,我 们 无 从 得 知 ， 那 又 该 怎么 办 呢 ? 目前 我 们 还 不 清楚 如 何 解决 这 个 
问题 。 

最 重要 的 问题 是 : 最 大 化 收益 的 拍卖 形式 随 着 私人 估 值 的 变化 而 变化 。 举 个 例 
F, 假设 只 有 一 个 物品 和 一 个 竞拍 者 ， 如 果 私 人 估 值 v 等 于 20 或 稍 大 一 点 ， 那 么 设 
置 牌价 为 20 效果 很 好 ,但 是 如 果 忆 小 于 20, 设置 牌价 20 效果 就 会 很 差 ( 这 时 候 牌价 
稍 小 于 20 效果 就 会 好 得 多 )。 这 样 看 来 最 大 化 社会 福利 的 机 制 确 实 很 特殊 ， 因 为 同样 
情况 下 存在 一 个 与 输入 无 关 的 满足 DSIC 的 最 优 机 制 。 


5.1.3 贝 叶 斯 分 析 


如 果 要 比较 两 类 不 同 拍卖 的 收益 ， 我 们 就 需要 一 个 能 在 输入 不 同 的 情况 下 比较 交 
易 情 况 的 模型 。 经 典 的 方法 就 是 使 用 平均 情况 分 析 或 者 贝 叶 斯 分 析 模 型 。 考 虑 由 以 下 
两 部 分 组 成 的 模型 : 


© 单 参数 环境 ( 见 3. 1 节 )。 假 设 对 于 每 个 ; HITREC, o DEX, WEE 
一 个 常数 M Efir: <M. 
o 相互 独立 的 概率 分 布 政 ，…，F,， 其 概率 密度 函数 1，…，_, 连 续 且 始终 为 


正 。 我 们 假设 参与 者 i 的 私人 估 值 vw, 服从 概率 分 布 FF。 另外 我 们 还 假设 对 于 
一 个 vx 二 吕 ， 每 个 分 布 函数 下 的 支撑 集 都 属于 [0，wrwx Jo ™ 
还 有 一 个 关键 假设 是 : 机 制 设计 者 事先 知道 概率 分 布 函数 ，…，F,。” 当 然 智 
能 体 的 私人 估 值 vw ，…，w, 依 然 是 私有 信息 ， 机 制 设计 者 事先 并 不 知道 。 男 外 由 于 我 





这 里 提 到 的 都 是 满足 DSIC 的 确定 性 拍卖 。 当 然 也 有 基于 牌价 的 随机 性 拍卖 ， 但 是 这 个 例子 背后 的 原 
理 对 于 随机 性 拍卖 也 是 适用 的 。 

卖家 收益 的 英文 为 revenue， 后 文中 我 们 将 其 简称 为 “收益 ”。 一 一 译 者 注 

概率 分 布 函 数 F;(z) 表 示 : 服从 分 布 F 的 随机 变量 取 值 不 超过 < 的 概率 。 

只 要 每 个 分 布 函 数 Fi 的 期 望都 是 有 限 值 ， 本 章 得 到 的 结论 就 都 成 立 。 

实际 应 用 时 ， 这 些 分 布 都 是 从 数据 中 得 到 的 ， 比 如 历史 上 进行 过 的 拍卖 竞价 数据 。 


®anod O 
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们 只 关注 满足 DSIC 的 拍卖 ， 在 这 样 的 拍卖 中 智能 体 是 拥有 占 优 策略 的 ， 所 以 他 们 并 
不 需要 知道 概率 分 布 函 数 Fi，…，F,。? 

在 贝 叶 斯 情境 中 ， 如 何 定义 “收益 最 优 ” 机 制 一 目 了 然 : 在 所 有 满足 DSIC 的 机 
制 中 ,期望 收 益 最 高 的 机 制 就 是 “收益 最 优 ” 机制 ( 假 设 智能 体 都 真实 竞价 ) 。 其 中 ， 
WARS PA EW oF, XF, X XF, W, 


5.1.4 再 谈 单 竞拍 者 和 单 物 品 


有 了 贝 叶 斯 模型 ， 单 竞拍 者 单 物 品 拍卖 就 很 容易 分 析 了 。 当 牌价 为 -时 拍卖 的 期 
望 收益 就 是 
r ¢ (i= Ftr)) 


交易 成 功 的 收藏 HEH me Sh OY E 


给 定 分 布 函数 正 时， 要 解 得 最 优 牌 价 ”~ 通 常 是 很 容易 的 。 我 们 称 最 优 牌价 为 分 布 
函数 下 的 垄断 价格 。 因 为 满足 DSIC 的 机 制 就 是 提供 一 个 牌价 (以 及 牌价 之 上 的 随机 
化 );， 所 以 提供 一 个 大 小 为 垄断 价格 的 牌价 就 是 收益 最 大 化 机 制 2> 。 举 个 例子 ， 如 果 
下 是 [0，1] 上 的 均匀 分 布 ， 即 在 L0,1] 上 F(x) 二 x， 那 么 可 以 得 到 垄断 价格 为 1/2， 
得 到 的 期 望 收益 为 1/4。 





5. 1.5 多 竞拍 者 


当 有 两 个 竞拍 者 时 ， 事 情 就 变 得 复杂 起 来 了 ， 这 时 候 DSIC 拍卖 机 制 设计 的 空间 
就 比 单 竞拍 者 时 的 设计 空间 (只 有 一 个 牌价 ) 复 杂 得 多 了 。 例 如 ， 考 虑 含有 两 个 竞拍 者 
的 单 物 品 拍卖 他们 的 估 值 相互 独立 且 服 从 [0，1] 上 的 均匀 分 布 。 我 们 当然 可 以 进行 
一 场 二 价 拍 卖 ( 见 2.4 节 ); 此 时 期 望 收益 就 是 竞价 较 低 竞拍 者 的 期 望 估 值 ， 也 即 1/3 
( 见 练 习 5. 1(a)) 。 

我 们 还 可 以 为 二 价 拍卖 增设 一 个 保留 价格 ， 就 像 eBay 拍卖 的 公开 竞价 一 样 。 在 
一 个 保留 价格 为 的 二 价 拍卖 中 ， 除 非 所 有 的 竞价 都 低 于 保留 价格 一 一 (这 种 情况 下 
没有 人 能 得 到 物品 )， 否 则 根据 分 配 规 则 ， 竞 价 最 高 的 竞拍 者 得 到 物品 。 相 应 地 ， 根 
据 支 付 规则 ， 赢 家 (如 果 有 的 话 ) 要 么 支付 次 高 的 竞价 ， 要 么 支付 保留 价格 ~>， 哪 个 高 
就 支付 哪个 。 从 收益 的 角度 来 看 ， 增 设 一 个 保留 价格 + 有 好 有 坏 : 当 所 有 竞价 都 低 于 
保留 价格 7 时， 你 会 损失 收益 ,但 只 要 有 一 个 竞价 高 于 保留 价格 +， 那么 增设 保留 价 
格 就 会 增加 收益 。 比 如 ， 当 两 个 竞拍 者 的 估 值 分 布 相 互 独立 且 服 从 L0，1] 上 的 均匀 分 
布 时 ， 增 设 一 个 1/2 的 保留 价格 就 可 以 将 这 个 二 价 拍卖 的 收益 从 1/3 提高 到 5/12( 见 








O ”在 没有 占 优 策 略 的 机 制 中 ， 例 如 单 物品 一 价 拍卖 ， 标 准 的 方法 是 考虑 “ 贝 叶 斯 -纳什 均衡 ”; 详 见 问 
题 5. 3。 贝 叶 斯 -纳什 均衡 分 析 方 法 中 会 假设 有 一 个 “公共 的 先 验 知识 ”， 即 所 有 的 智能 体 都 知道 分 布 
POP, os Fao 

OQ 根据 显示 原理 ， 我 们 可 以 聚焦 于 DSIC HLA. Æ DSIC 机 制 对 应 的 牌价 上 进行 最 优化 ， 这 个 最 优 牌 价 
就 是 所 有 机 制 设计 空间 (包括 DSIC 和 非 DSIC 机 制 ) 中 的 最 优 机 制 。 - 译 者 注 








练习 5. 1(b))。 那 么 能 不 能 获得 更 高 的 收益 呢 ? 比如 换 一 个 不 同 的 保留 价格 ， 或 者 换 
一 个 完全 不 同 的 拍卖 形式 ? 


5.2 最 优 DSIC 机 制 的 性 质 


本 章 的 主要 目标 是 : 在 任意 单 参数 环境 和 概率 分 布局 ，…，F, 下 ， 给 出 最 优 
DSIC 机 制 ( 期 望 收 益 最 大 化 机 制 ) 的 明确 形式 。 


5.2.1 准备 工作 


我 们 可 以 利用 上 章 提 到 的 显示 原理 (定理 4.3) 来 简化 问题 。 因 为 所 有 DSIC 的 机 制 
都 等 价 于 DSIC 的 直接 机 制 (x，P) 一 一 故 和 DSIC 的 直接 机 制 期 望 收益 相同 ， 所 以 我 们 
可 以 把 注意 力 集中 到 直接 机 制 上 来 。 因 此 ， 我 们 默认 智能 体 都 真实 竞价 ( 即 b= v). 
根据 定义 ， 满 足 DSIC 机 制 (x，p) 的 期 望 收益 是 


Er] Daw] (5.1) 
其 中 期 望 基于 智能 体 的 估 值 分 布下 三 书 X…XF。 我 们 不 清楚 如 何在 满足 DSIC 机 制 
的 设计 空间 上 直接 最 大 化 表达 式 (5. 1)。 所 以 接 下 来 ,我 们 将 研究 机 制 期 望 收益 的 第 
二 种 形式 。 这 个 形式 只 和 分 配 规则 有 关 ， 而 与 支付 规则 无 关 ， 因 此 期 望 收益 的 最 大 化 
就 容易 得 多 了 。 


5.2.2 虚拟 估 值 


期 望 收益 的 第 二 种 形式 使 用 了 虚拟 估 值 这 个 重要 概念 。 对 于 估 值 w, 服 从 概率 分 布 
;的 智能 体 来 说 ， 他 的 虚拟 估 值 定义 为 : 


1 = F;Cy;) 
f, Co) 


智能 体 的 虚拟 估 值 和 他 自己 的 私人 估 值 及 分 布 有 关 ， 但 和 其 他 智能 体 的 私人 估 值 及 分 
布 无 关 。 例 如 ，F; 是 LO，1] 上 的 均匀 分 布 ， 当 zEL0，1] 时 ,F(z) 二 zx,，fi(z) 二 1， 
pi(z) 二 xz 一 (1 一 z)/1 二 2z 一 1。 在 数值 上 ， 虚 拟 估 值 最 多 和 其 对 应 的 估 值 相等 ， 另 外 
虚拟 估 值 可 以 是 负数 。 练 习 5. 2 中 有 更 多 的 例子 。 

虚拟 估 值 在 期 望 收益 最 大 化 拍卖 的 设计 过 程 中 起 到 了 重要 的 作用 。 但 虚拟 估 值 到 
底 意味 着 什么 呢 ? 下 面 是 解释 这 个 表达 式 的 一 种 方法 : 





prlu) = v; (5.2) 


wde a — Pw 
Pe fiw) 
KRG DE Y 


都 能 体 赚 取 的 信息 程 全 


将 vw 看 作 可 以 从 智能 体 i 那里 获得 的 最 大 收益 ， 将 第 二 项 看 作 因 提 前 不 知道 vi 而 无 法 
避免 的 收益 损失 ， 即 信息 租金 。Pi (vi) 的 第 二 种 解释 是 “收益 曲线 ”在 wv 处 的 斜率 ， 
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其 中 ， 收 益 曲 线 是 指 从 智能 体 处 获得 的 期 望 收益 关于 交易 成 功 概率 的 函数 曲线 ， 此 时 
智能 体 的 估 值 分 布 服从 已 。 问 题 5. 1 会 对 这 种 解释 进行 阐述 。 
5.2.3 期 望 收 益 等 于 期 望 虚拟 福利 


下 面 的 引 理 是 收益 最 优 拍卖 所 有 性 质 中 的 “主力 ”。 我 们 会 在 5.4 节 给 出 证 明 ， 
其 实 就 只 是 一 些 计 算 而 已 。 


引 理 5.1 在 任意 单 参 数 环境 下 ， 若 估 值 分 布 为 FI，…，F,， 在 所 有 满足 DSIC 
的 机 制 (x，p) 中 ， 对 于 任意 智能 体 i 和 其 他 智能 体 的 估 值 组 合 v_;， 都 有 
E, ~r, Lp;(v)] = E, ~r Lg: Cv) »。 zxi(v)| (5. 3) 


也 就 是 说 ， 来 自 一 个 智能 体 的 期 望 支付 等 于 其 期 望 虚拟 估 值 。 这 个 性 质 只 在 考虑 期 望 
的 情况 下 成 立 ， 单 独 来 看 是 不 成 立 的 。° 

利用 上 面 的 引 理 5. 1， 我 们 可 以 得 到 以 下 重要 结论 。 

定理 5. 2( 期 望 收 益 等 于 期 望 虚拟 福利 ) ”在 任意 单 参数 环境 下 ， 若 估 值 分 布 为 
Fi, +, Fy, TP Aw RX DSIC 的 机 制 (x，p) 都 有 





Enr 19.60) | = Bye] Yew) + xiv) | (5.4) 
i=l i=l 
ws 
期 望 收益 期 望 虚拟 福利 


证 明 : 对 等 式 (5. 3) 两 边 取 " ,一 下 ,的 期 望 ， 我 们 得 到 
E.~# plo) ] = Erlo; Cvi) » zi(v)] 
应 用 期 望 的 线性 性 质 ( 两 次 ) 得 到 


Es| cv) |= YELP] 
i=l i=1 
= S)E,~rl gi Cv) ® x;(v) | 
i=l 


a E.r| po) xv) | 
证 毕 。 国 
表达 式 (5. 4 的 第 二 项 就 是 机 制 期 望 收 益 的 第 二 种 形式 ， 令 人 高 兴 的 是 ， 这 个 形 
式 很 简洁 。 如 果 我 们 将 gp.(w,) 蔡 换 成 ww， 那么 我 们 就 遇 到 了 “ 老 朋友 ”， 机 制 的 期 望 福 
利 。 正 因为 这 样 ， 我 们 将 Y) po) «2, o) 称 作 机 制 关 于 估 值 组 合 v 的 虚拟 福利 。 定 
理 5.2 表明 ， 在 满足 DSIC 的 机 制 空 间 上 对 期 望 收益 进行 最 大 化 ， 可 以 归 约 为 在 同一 
个 空间 上 将 期 望 虚 拟 福利 进行 最 大 化 。 


日 例如 ， 虚拟 估 值 可 以 为 负 但 是 支付 总 是 非 负 。 





5.2.4 最 大 化 期 望 虚拟 福利 


表达 式 (5. 4) 真 的 是 简单 到 令 人 惊讶 。 它 表明 : 即便 我 们 关心 的 只 是 收益 ,我 们 
仍然 只 需要 聚 焦 在 分 配 的 优化 问题 上 。 这 个 替代 形式 有 更 强 的 可 操作 性 ， 接 下 来 我 们 
就 寻找 能 够 将 这 个 替代 形式 最 大 化 的 机 制 。 

那么 ， 我 们 应 该 如 何 选择 分 配 规则 x 来 最 大 化 期 望 虚拟 福利 


n 


E| Yeilodx(v) | (5.5) 
在 这 个 问题 中 ， 对 于 每 个 估 值 组 合 ve 我 们 都 可 以 自由 地 选择 x(v)， 而 且 对 
于 概率 分 布 玉 和 虚拟 估 值 g; (wv,) 也 没有 任何 限制 。 因 此 一 个 显而易见 的 方法 就 是 


逐 点 最 大 化 : 当 分 配 规则 可 行 时 ， 单独 对 每 个 v 都 选择 一 个 x(v) 以 最 大 化 虚拟 福利 
Nl go) eano). 我 们 将 这 种 分 配 规则 称 为 虚拟 福利 最 大 化 分 配 规则 。 这 其 实 和 福 
利 最 大 化 分 配 规 则 (4.1) 和 (4.2) 一 样 ， 只 不 过 智能 体 的 估 值 变 成 了 虚拟 估 值 (5. 2) 。 


例如 ， 在 单 物 品 拍卖 中 ， 对 于 每 个 vz， 可行 性 限制 条 件 为 pP Xi(v) S1, EH 


福利 最 大 化 分 配 规 则 就 是 将 物品 分 配给 虚拟 估 值 最 高 的 竞拍 者 。 当 然 也 不 完全 是 这 
样 : 注意 到 虚拟 估 值 可 能 为 负 ( 例 如 ，g;(vw) 二 2 vw 一 1，v 服 从 [0，1] 上 的 均匀 分 布 )， 
这 时 如 果 每 个 竞拍 者 的 虚拟 估 值 都 为 负 ， 那 么 想 要 最 大 化 虚拟 福利 ， 就 不 应 该 分 配 物 
品 给 任何 人 。° 

在 所 有 单调 或 非 单 调 的 分 配 规 则 中 ， 虚 拟 福 利 最 大 化 分 配 能 够 实现 期 望 虚拟 福利 
最 大 化 。 关 键 问题 是 ; 虚拟 福利 最 大 化 规则 是 单调 的 吗 ? 如 果 是 的 话 ， 那 么 根据 迈 尔 
森 引 理 ( 定 理 3.7)， 它 就 是 满足 DSIC 的 机 制 ， 再 利用 定理 5.2， 这 个 机 制 的 期 望 收 
益 就 是 所 有 机 制 中 最 大 的 。 


5.2.5 正则 分 布 


虚拟 福利 最 大 化 分 配 规则 的 单调 性 依赖 于 估 值 分 布 。 下 面 的 定义 给 出 了 该 单调 性 
的 一 个 充分 条 件 。 


定义 5.3( 正 则 分 布 ) 如果 估 值 分 布 F LTEN ET 
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如 果 所 有 智能 体 的 估 值 都 服从 正则 分 布 ， 那 么 虚拟 福利 最 大 化 分 配 规则 就 是 单调 
的 ( 见 练习 5.5。 另 外 ， 若 其 中 出 现 多 个 赢家 ， 随 机 选择 一 个 打破 僵局 ) 。 

例如 ，L0，1J 上 的 均匀 分 布 是 正则 的 ， 因 为 它 对 应 的 虚拟 估 值 函数 是 2v 一 1。 很 





日 ”注意 到 在 5. 1 节 的 单 竞拍 者 例子 中 ,最 大 化 期 望 收益 并 不 总 是 意味 着 一 定 要 卖 出 物品 。 
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多 其 他 常见 的 分 布 也 是 正则 的 (练习 5.3)。 非 正则 的 分 布 包括 许多 多 峰 分 布 和 长 尾 
分 布 。 

当 估 值 分 布 是 正则 分 布 时 ， 利 用 迈 尔 森 引 理 (定理 3.7) 我 们 就 可 以 将 (单调 的 ) 虚 
拟 福利 最 大 化 分 配 规则 扩展 成 一 个 DSIC 的 机 制 。 以 下 就 是 一 个 最 大 化 期 望 收益 的 
DSIC 机 制 . © 





oo 
假设 : 每 个 智能 体 的 估 值 分 布 都 是 正则 的 (定义 5 
1. 根据 表达 式 (5.2) 将 智能 体 ; 和 


2. 选择 能 够 最 大 化 虚拟 福利 D) p) x 的 可 行 分 配 规则 (zi，…，z) © 


3. 根据 迈 尔 森 支 付 公 式 ( 式 (3.5) 和 式 (3. 6)) 决 定 支付 。 号 











我 们 将 这 个 机 制 称 为 在 给 定单 参数 环境 和 估 值 分 布下 的 虚拟 福利 最 大 化 机 制 。 

定理 5.4( 虚 拟 福利 最 大 化 机 制 是 最 优 的 ) 在 任意 单 参 数 环 境 和 正则 分 布 
F，"…，F 下 ,下 ， 虚 拟 福利 最 大 化 机 制 就 是 一 个 能 将 期 望 收益 最 大 化 的 DSIC 机 制 。 

定理 5.4 意味 着 ,收益 最 大 化 机 制 和 福利 最 大 化 机 制 几乎 一 模 一 样 ， 区 别 仅仅 在 
于 前 者 使 用 虚拟 估 值 替代 了 佑 值 。 从 这 个 意义 上 说 ， 收 益 最 大 化 可 以 归 约 为 福利 最 
Kb. 

备注 5.5( 贝 叶 斯 激励 相 容 机 制 ) 概括 3.4 节 和 本 节 的 推导 过 程 ， 可 以 得 出 一 个 
定理 5.4 的 增强 版 本 : 这 个 定理 所 指定 的 机 制 不 仅 在 所 有 的 DSIC 机 制 中 能 实现 期 望 
收益 的 最 大 化 ， 更 一 般 化 的 ， 它 在 所 有 “ 贝 叶 斯 激励 相 容 ”(BIC) 机 制 中 能 实现 期 望 
收益 的 最 大 化 。 当 估 值 分 布 为 Fi，…， 下 ,时 ， 满足 BIC 的 机 制 是 真实 报价 能 够 形成 
贝 叶 斯 -纳什 均衡 的 机 制 ( 定 义 见 问题 5.3)。 在 所 有 可 能 的 估 值 分 布 F，…， 下 ,上 ， 
DSIC 机 制 都 是 满足 BIC 的 。 因 为 在 所 有 BIC 机 制 中 最 大 化 期 望 收益 的 机 制 实际 上 就 
是 DSIC 的 ， 所 以 DSIC 是 “免费 ”的 。 显 示 原 理 ( 定 理 4.3) 也 能 应 用 到 满足 BIC 的 
机 制 上 (问题 5.4)， 这 意味 着 ， 在 定理 5.4 的 假设 下 ， 任 何 机 制 ( 比 如 一 价 拍卖 ) 在 贝 
叶 斯 -纳什 均衡 下 的 期 望 收 益 都 不 可 能 比 DSIC 的 最 优 机 制 高 。 


5.2.6 最 优 单 物品 拍卖 
定理 5. 4 告诉 我 们 如 何 设 计 期 望 收益 最 大 化 机 制 ， 而 且 这 个 机 制 还 是 比较 明确 且 





昌 再 附加 额外 的 条 件 本 章 的 结果 就 可 以 应 用 到 非 正则 的 佑 值 分 布 上 。 详 见 说 明 。 

O ”存在 多 个 候选 者 打破 僵局 最 简单 的 方法 就 是 : 在 原来 可 行 结果 上 已 经 确定 的 全 排列 上 再 进行 一 次 字 
典 排序 。 

旧 ” ”如果 每 个 zz 只 能 是 0 或 1， 支付 规则 就 很 简单 : 在 保持 其 他 智能 体 竞 价 不 变 的 情况 下 ， 每 个 赢家 支付 
确保 他 一 直 能 赢 的 最 低 竞 价 。 
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易 实现 的 最 优 机 制 。 但 是 ， 这 些 机 制 并 不 容易 解释 。 那 么 它们 能 化 简 成 我 们 所 熟悉 的 
机 制 吗 ? 

让 我 们 回 到 单 物品 拍卖 。 假 设 竞拍 者 是 独立 同 分 布 的 ， 即 他 们 有 相同 的 估 值 分 布 
下 ， 当 然 也 有 相同 的 虚拟 估 值 函数 pg。 再 假设 下 是 严格 正则 的 ， 即 o 是 严格 递增 函数 。 
那么 虚拟 福利 最 大 化 机 制 就 是 将 物品 分 配给 虚拟 估 值 最 高 且 非 负 的 竞拍 者 ， 如 果 这 样 
的 竞拍 者 存在 的 话 。 因 为 所 有 竞拍 者 的 虚拟 估 值 函数 都 相同 ， 所 以 虚拟 估 值 最 高 的 苋 
拍 者 就 是 估 值 最 高 的 竞拍 者 。 这 样 的 分 配 规 则 和 保留 价格 为 p “(0) 的 二 价 拍卖 的 分 配 
规则 相同 。 根 据 定理 3.7(b)， 支 付 规则 也 应 保持 一 致 。 因 此 ， 对 于 任意 数量 的 独立 
同 分 布 的 竞拍 者 ， 他 们 的 估 值 服从 同一 个 严格 正则 的 分 布 时 ，eBay 拍卖 就 是 一 个 最 
优 拍卖 形式 ! 回 到 5. 1 节 结 尾 处 所 描述 的 情境 中 ， 如 果 所 有 估 值 都 服从 LO0，1] 上 的 均 
句 分布， 那么 保留 价格 为 1/2 二 pg '(0) 的 二 价 拍卖 就 是 最 优 的 。 考 虑 到 DSIC 拍卖 很 
大 的 设计 空间 ， 我 们 不 免 惊讶 于 如 此 简单 且 实 用 的 拍卖 形式 竟然 就 是 理论 上 最 优 的 。 


5.3 案例 分 析 : 关键 字 搜索 拍卖 中 的 保留 价格 


说 了 这 么 多 ， 最 优 机 制 设计 的 理论 在 实际 应 用 时 到 底 是 怎样 的 呢 ? 本 节 讨 论 
2008 年 的 一 次 实验 ， 这 个 实验 探寻 的 是 最 优 拍卖 理论 能 和 否 为 雅虎 关键 字 搜索 增加 
收益 。 

回想 2. 6 节 中 我 们 关于 关键 字 搜 索 拍 卖 的 模型 。 哪 一 个 拍卖 能 够 最 大 化 期 望 收益 
E? 如果 我 们 假设 竟 拍 者 的 单位 点 击 估 值 独立 同 分 布 于 正则 分 布 下， 虚拟 估 值 函数 为 
9， 那 么 最 优 拍卖 只 需要 考虑 那些 竞价 至 少 为 保留 价格 wp (0) 的 竞拍 者 ， 并 将 这 些 竞 
拍 者 按照 竞价 从 高 到 低 排 列 即 可 。 见 练习 5. 8。 

雅虎 在 2008 年 之 前 都 是 怎么 做 的 呢 ? 首先 ， 他 们 使 用 相当 低 的 保留 价格 ， 一 开 
始 是 0.01 美元 ， 接 着 是 0. 05 美元 ， 最 后 是 0. 10 美元 。 更 加 天 真 的 是 ， 他 们 对 所 有 
的 关键 词 使 用 相同 的 保留 价格 0. 10 美元 ， 即 使 某 些 关 键 词 明显 需要 比 其 他 关键 词 有 
更 高 的 保留 价格 (比如 “离婚 律师 ”相对 于 “披萨 ”)。 如 果 雅 虎 分 别 将 每 个 关键 词 的 
保留 价格 变 成 理论 上 最 优 拍卖 的 保留 价格 ， 收 益 又 会 怎样 呢 ? 

在 实验 的 第 一 步 ， 用 一 个 正 态 对 数 估 值 分 布 对 过 去 约 500 000 个 不 同 关键 词 的 竞 
价 数据 进行 拟 合 =” 。 实 验 的 量化 结果 不 依赖 于 这 一 步 的 具体 细节 。 

实验 的 第 二 步 ， 假 设 估 值 服从 给 定 的 分 布 ， 计 算 每 个 关键 词 的 理论 最 优 保留 价 
格 。 和 预想 的 一 样 ， 不 同 关 键 词 的 最 优 保留 价格 大 相 径 庭 ， 许 多 关键 词 的 理论 最 优 保 





O ”因为 雅虎 和 其 他 搜索 引擎 一 样 ， 使 用 的 是 基于 GSP 的 非 DSIC 拍卖 ， 这 样 的 拍卖 并 不 能 保证 竞价 是 真 
实 的 。 在 这 个 实验 中 ， 估 值 是 利用 竞价 进行 逆向 工程 而 得 到 的 。 该 逆向 工程 所 做 的 假设 是 : 竞拍 者 
在 这 个 非 DSIC 拍卖 下 所 用 的 均衡 策略 ,与 他 在 收益 最 大 化 的 DSIC 拍卖 下 所 用 的 占 优 策略 ， 两 者 所 
导致 的 结果 相等 价 (练习 5. 8)。 


* 
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留 价格 是 0. 30 美元 或 者 0.40 美元 。 雅 虎 先前 在 这 些 关 键 词 上 所 使 用 的 统一 保留 价 
格 ， 与 最 优 拍卖 理论 所 建议 的 最 优 保留 价格 相 比 而 言 太 低 了 。 

实验 最 终 就 是 为 了 测试 理论 最 优 保 留 价格 的 效果 。 雅 虎 的 领导 层 想 要 更 加 保守 一 
点 ， 将 新 的 保留 价格 定 为 旧 保 留 价格 和 理论 最 优 保留 价格 的 平均 值 ? 。 这 个 改变 的 确 
起 作用 了 : 拍卖 的 收益 上 升 了 好 几 个 百分点 (注意 基数 很 大 )， 新 的 保留 价格 在 那些 估 
值 高 却 竞 争 性 不 强 的 关键 字 上 尤其 有 效 。 雅 虎 总 裁 认为 ， 使 用 更 合适 的 保留 价格 是 
2008 年 第 三 季度 财报 在 搜索 方面 能 取得 更 高 收益 的 最 重要 原因 。 


5.4 引 理 5.1 的 证 明 


本 节 给 出 引 理 5. 1 的 一 个 证 明 ， 即 证 明 若 wv;~~F;， 则 从 智能 体 i 处 获得 的 期 望 收 
益 等 于 他 获得 的 期 望 虚拟 福利 。 现 在 开始 证 明 ， 首 先 回想 迈 尔 森 的 支付 公式 (3. 6): 


P: Cv; . v) | 


表示 在 分 配 规则 为 x， 估 值 组 合 为 " 时 的 满足 DSIC 的 机 制 中 智能 体 i 的 支付 。 假 定 
分 配 函 数 z;(z，v-;) 可 微 ， 我 们 就 可 以 推导 出 这 个 等 式 。 由 高 等 微 积 分 可 知 ， 这 个 支 
付 公 式 在 更 加 一 般 的 单调 函数 zx;(z，v-;) 上 也 成 立 ， 比 如 分 段 常 阴 数 ， 这 就 提供 了 关 
于 导数 x,(z，w-,) 和 对 应 积分 的 合理 解释 。 对 于 任意 有 界 单调 函数 ,下面 所 有 的 证 明 
步骤 都 是 完全 严格 的 ， 且 不 存在 明显 的 困难 ， 证 明 步 又 中 会 用 到 分 部 积分 之 类 的 计算 
方法 。 有 兴趣 的 读者 可 以 关注 一 下 细节 。° 

公式 (3. 6) 表 明 支 付 完全 由 分 配 规则 决定 。 因 此 ， 至 少 在 原则 上 ， 我 们 可 以 认为 
拍卖 的 期 望 收益 完全 由 分 配 规则 确定 ， 不 需要 显 式 地 考虑 支付 规则 。 那 么 变形 得 到 的 
收益 公式 是 否 比 原始 公式 更 容易 最 大 化 呢 ? 不 实际 做 一 下 是 很 难 知 道 答案 的 ， 所 以 现 
在 开始 动手 。 

第 一 步 : 选 定 一 个 智能 体 i。 根 据 迈 尔 森 的 支付 公式 ， 给 定 其 他 智能 体 估 值 组 合 
v-;， 我 们 可 以 写 出 i WWE R~ FOAR: 


E, r [p.(v) ]= [por fC) do, 


= lag [f zea, (za ) de |f; (udu, 


0 


第 一 个 等 式 利用 了 智能 体 估 值 之 间 的 独立 性 ， 即 给 定 的 估 值 组 合 v-; 和 vw; 服从 的 
分 布 F; 之 间 没 有 关系 。 


上 
ze x; (z,v_;)dz 





日 ”从 理论 和 经 验 上 来 讲 ， 这 个 倾向 保守 的 修改 为 收益 增加 也 做 出 了 很 大 贡献 。 当 保留 价格 接近 理论 最 
优 值 时 ， 收 益 的 边际 回报 通常 是 递减 的 ， 直 观 的 原理 是 ， 期 望 收 益 在 最 优点 处 关于 保留 价格 的 导数 
是 0。 

SO 例如 ， 除 了 在 数目 可 数 的 一 些 点 上 之 外 ， 其 他 时 候 每 个 单调 的 有 界 两 数 都 是 可 积 且 可 微 的 。 





这 一 步 原 则 上 我 们 知道 是 可 能 的 一 一 将 期 望 支付 重 写成 分 配 规则 的 形式 。 为 了 让 
这 个 等 式 更 有 用 ， 我 们 需要 一 些 简 化 。 

第 二 步 : 如 果 你 有 一 个 双重 积分 (或 者 双重 求 和 ) 不 知 如 何 求解 ， 可 以 尝试 一 下 交 
换 积分 顺序 。 交 换 下 式 的 积分 顺序 : 


ig [| . x. (z,v de | fico dee, 


得 

lig [[ F Codu] a del Cay edie 
上 式 可 以 简化 成 

[a = Oe) +e 2) Cee de 
这 表明 我 们 在 逐渐 接近 目标 。 


第 三 步 : 要 想 将 一 个 积分 转换 成 一 个 更 容易 解释 的 形式 ， 分 部 积分 也 是 值得 尝试 的 
方法 ， 尤 其 是 在 积分 函数 里 明显 有 一 个 导数 的 时 候 。 这 样 我 们 就 可 以 得 到 进一步 地 简化 : 





| (1— F(z)) + z + x! (zrv,) de 
0 


glz) h'ta) 


=(= F(z. mles va) [im 


=0-0 





ws "silat « U 8 —shter de 





=| "{ ("Ze") Cu sv. Ede (5. 6) 


第 四 步 : 现在 我 们 可 以 将 式 (5.6) 看 成 期 望 估 值 的 形式 了 ， 其 中 xz 服从 概率 分 布 
Fis MÆR. 2) 关 于 虚拟 估 值 的 定义 ， 它 的 期 望 表达 式 是 可 -Lo (um) zx(v)]。 
综合 一 下 ， 我 们 有 

E, ~r, [p(v)] = E~r Leu) $ xi(v)] 
即 我 们 所 需要 的 式 子 。 


总 结 


o 与 福利 最 大 化 机 制 不 同 ， 收 益 最 大 化 机 制 会 随 着 (私人 ) 估 值 的 变化 而 变化 。 

e 用 平均 情况 或 贝 叶 斯 方法 比较 不 同 机 制 时 ， 每 个 智能 体 的 估 值 都 独立 地 服从 
某 个 概率 分 布 ， 且 机 制 设 计 者 知道 这 些 概率 分 布 。 最 优 机 制 就 是 在 这 些 分 布 
下 期 望 收益 最 高 的 机 制 。 
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o 使 用 式 (5.2) 中 的 虚拟 估 值 这 个 重要 概念 ，DSIC 机 制 的 期 望 收益 就 可 以 完全 
由 分 配 规 则 来 表示 。 

o 如 果 一 个 估 值 分 布 所 对 应 的 虚拟 估 值 函数 是 非 减 的 ， 那么 就 称 该 估 值 分 布 为 
正则 的 。 很 多 常见 的 分 布 都 是 正则 的 。 

e 在 正则 估 值 分 布下 ， 最 优 机 制 就 是 一 个 虚拟 福利 最 大 化 算 子 ， 此 算 子 针对 任 
意 估 值 组 合 ， 和 输出 一 个 最 大 化 虚拟 福利 的 结果 。 

e 单 物 品 拍卖 中 ， 如 果 竞 拍 者 估 值 独立 同 分 布 于 某 一 个 正则 分 布 ， 那 么 最 优 拍 
卖 就 是 一 个 带 保留 价格 的 二 价 拍卖 。 

e 2008 年 ,雅虎 借助 最 优 机 制 设 计 理论 将 关键 字 搜 索 收益 增加 了 好 几 个 百分点 。 


说 明 


本 章 的 模型 和 主要 结果 都 来 源 于 Myerson(1981)， 可 以 应 用 到 非 正 则 分 布下 的 机 
制 和 满足 贝 叶 斯 激励 相 容 的 机 制 也 出 自 这 里 (备注 5. 5)。Myerson(1981) 还 强调 了 智 
能 体 估 值 分 布 相互 独立 这 个 假设 的 重要 性 ，Cremer 和 McLean(1985) 进 一 步 展 开 了 这 
个 问题 的 讨论 。 非 正则 分 布下 ， 虚 拟 福利 最 大 化 分 配 规则 不 是 单调 的 ， 而 要 解决 最 大 
化 期 望 虚拟 福利 问题 ， 单 调 的 分 配 规则 又 是 必要 的 。 这 个 矛盾 可 以 通过 以 下 方法 解 
Be, 对 虚拟 估 值 函数 进行 “加 工 *， 从 而 使 分 配 规 则 满足 单调 性 的 同时 ,保持 机 制 的 
虚拟 福利 不 变 。 这 些 扩展 内 容 可 以 参考 Hartline(2016) 的 处 理 方法 。 

Ostrovsky 和 Schwarz(2009) 描 述 了 雅虎 的 实验 ， 实 验 内 容 是 研究 如 何 设置 关键 
字 搜 索 拍卖 的 保留 价格 (5. 3 节 )。 问 题 5. 1 中 虚拟 估 值 的 收益 曲线 的 解释 来 源 于 Bu- 
low 和 Roberts(1989)。 问 题 5.2 来 源 于 Azar 等 人 (2013)。 问 题 5.3 和 “收益 等 价 原 
理 ” 息 息 相 关 ， 由 Vickrey(1961) 提 出 ; 关于 收益 等 价 的 完美 前 述 可 以 参考 Krishna 
(2010), 


练习 


练习 5.1 考虑 单 物 品 拍卖 , 其 中 两 个 竞拍 者 的 估 值 独立 地 服从 [0，1] 上 的 均匀 
分 布 。 
(a) 证 明 二 价 拍卖 (无 保留 价格 ?得 到 的 期 望 收 益 是 1/3。 
Cb) 证 明 二 价 拍卖 (保留 价格 为 1/2) 得 到 的 期 望 收益 是 5/12。 
练习 5.2 计算 基于 下 列 估 值 分 布 的 虚拟 估 值 函数 。 
(a) [0，aj 上 的 均匀 分 布 ， 其 中 a 二 0。 
(b) 参数 为 4 二 0 的 指数 分 布 ( 只 考虑 L0，ce) 部 分 ) 。 
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练习 5.3 
练习 5.4 


练习 5.5 


练习 5.6 


练习 5.7 


练习 5.8 
练习 5.9 


练习 5.1 


问题 


问题 5. 1 


© 





(c) 给 定 分 布 为 Fo)=1- 只 考虑 [0，co) 部 分 ， 其 中 常数 co. 
练习 5. 2 中 的 哪些 分 布 是 正则 分 布 ( 定 义 5. 3)? 
若 估 值 分 布 的 风险 率 [ se 2 关于 忆 非 递减 ， 则 称 估 值 分 布 满足 风险 率 单 


调 (Monotone Hazard Rate, MHR),° 

(a) 证 明 满 足 MHR 条件 的 分 布 都 是 正则 的 。 

(b) 练习 5.2 中 的 哪些 分 布 满足 MHR 条 件 ? 

证 明 对 于 单 参数 环境 和 正则 估 值 分 布 Fi，…，F,， 虚 拟 福利 最 大 化 分 配 规 
则 是 单调 的 (定义 3.6)。 给 定 可 行 输出 的 一 个 固定 的 全 排列 ， 以 字典 序 的 
方式 打破 平局 。 

(HH) 对 于 练习 5. 2(c) 的 估 值 分 布 ， 如 果 参 数 c= 二 1， 则 拍卖 的 期 望 收 益 未 必 
等 于 期 望 虚拟 福利 。 你 应 该 怎样 解释 这 个 结论 和 定理 5. 2 的 矛盾 ? 

考虑 上 物品 拍卖 ( 例 3.2)， 其 中 竞拍 者 的 估 值 独立 同 分 布 于 正则 分 布 上 。 
描述 一 个 最 优 拍 卖 ， 并 回答 保留 价格 依赖 于 下 列 哪 一 项 : k, n, F? 

针对 关键 字 搜索 拍卖 ( 例 3. 3) 重 复 之 前 的 练习 。 

考虑 单 参数 环境 和 正则 分 布 F ，…， 己 ， 对 于 cEL0，1]j， 如 果 一 个 DSIC 
机 制 总 是 选择 虚拟 福利 至 少 是 最 大 值 的 a 倍 的 可 行 分 配 ， 我 们 就 称 这 样 的 
机 制 为 a- 近似 虚拟 福利 最 大 算 子 。 证 明 a- 近 似 虚 拟 福 利 最 大 算 子 的 期 望 收 
益 至 少 是 最 优 机 制 的 < 倍 。 
0 在 5.3 节 关键 字 搜 索 拍 卖 中 ， 提 高 保留 价格 对 于 估 值 高 ( 单 次 点 击 估 值 明 

显 高 于 旧 的 保留 价格 0. 10 美元 ) 但 竞拍 者 很 少 ( 少 于 等 于 6 个) 的 关键 字 
极其 有 效 。 给 出 至 少 两 个 你 认为 具有 这 样 性 质 的 关键 字 并 解释 原因 。 


本 问题 将 推导 出 对 于 虚拟 估 值 go) = o E O I A PE AA R 


述 。 考 虑 [0，ws.] 上 严格 单调 递增 的 分 布 函 数 下 ， 其 概率 密度 函数 f 为 
TEs FOP Vx +O. 

对 于 估 值 分 布 服从 下 的 单 竞 拍 者 ， 当 交易 成 功 概率 为 EL0O，1] 时 ， 定 义 
V(g) 二 FF (1 一 gq) 为 (唯一 ) 牌 价 。 定 义 R(g) 二 gq，V(g) 为 从 竞拍 者 处 获得 
的 期 望 收益 。 函 数 R(g) 是 下 的 收益 曲线 函数 ， 注意 R(0) 二 R(1) 二 0。 





关于 MHR 条 件 的 直观 解释 ， 可 以 考虑 一 个 一 直 亮 着 的 电灯 泡 什么 时 候 坏 的 例子 。 当 一 个 电灯 泡 还 设 
坏 时 ， 它 现在 立马 坏 的 概率 是 随 着 已 工作 时 长 的 增加 而 增加 的 。 
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问题 5. 2 


问题 5. 3 


问题 5. 4 





(a) [0，1] 上 的 均匀 分 布下 的 收益 曲线 函数 是 什么 ? 

(b) 证 明 收益 曲线 在 g 点 的 斜率 ( 即 R'(g)) 是 pg(V(q))， 其 中 p 是 概率 分 布 
为 下 时 的 虚拟 估 值 函数 。 

Cc) 证 明 当 且 仅 当 收 益 曲线 是 止 的 时 候 ， 概 率 分 布 是 正则 的 。 

(H) 考 虑 单 竞拍 者 ， 其 估 值 分 布 服从 正则 分 布 下， 且 该 分 布 满足 问题 5. 1 

中 的 假设 。 设 p 为 的 中 位 数 ， 即 FC(p)= 二 1/2。 证 明 牌 价 为 bp 时， 至少 可 

以 获得 最 优 牌价 时 50% 的 期 望 收益 ， 此 时 概率 分 布 为 下 。 

本 问题 将 引入 贝 叶 斯 -纳什 均衡 的 概念 ， 并 比较 一 价 和 二 价 单 物品 拍卖 的 

期 望 收益 。 

一 价 拍卖 没有 占 优 策略 ， 所 以 我 们 需要 一 个 新 的 概念 来 对 其 进行 推理 。 假 

设 竞 拍 者 的 佑 值 独立 同 分 布 于 一 个 公共 已 知 的 概率 分 布下。 一 价 拍卖 中 ， 

竞拍 者 i 的 策略 就 是 一 个 事先 制定 好 的 竞价 ， 也 就 是 规划 函数 6;(，)， 它 

将 竞拍 者 的 估 值 vw 映射 到 出 价 5;(w)。 意 思 是 说 : “ 当 我 的 估 值 是 v; 时 ， 我 

会 出 价 b,(v)”。 我 们 假设 竞拍 者 的 竞价 策略 是 公共 知识 ， 而 估 值 (及 其 导 

致 的 报价 ) 仍 是 私人 的 。 我 们 称 符合 以 下 条 件 的 策略 组 合 辣 (，)，… 

b,(，) 为 一 个 贝 叶 斯 -纳什 均衡 : 在 给 定 自身 信息 的 情况 下 ， 每 个 竞拍 者 总 

是 最 优 地 竞价 。 也 就 是 说 ， 对 每 个 竞拍 者 i 及 其 估 值 wv;， 报 价 5;(wv;) 都 能 够 

最 大 化 i 的 期 望 效 用 ， 这 个 期 望 基于 其 他 竞拍 者 竞价 的 分 布 ， 其 中 其 他 竞 

拍 者 的 竞价 由 下 和 b-_; 决 定 。 

(a) 假设 下 是 [0，1] 上 的 均匀 分 布 。 验 证 对 于 每 个 i 和 w;， 设 置 b; (wi) 二 
vi(n 一 1)/n 是 一 个 贝 叶 斯 -纳什 均衡 。 

(b) 证 明 : 在 一 价 拍卖 中 ， 上 述 贝 叶 斯 -纳什 均衡 下 卖家 的 期 望 收益 等 于 二 
价 拍卖 中 的 真实 报价 结果 下 卖家 的 期 望 收益 。 

(c) CH) 将 (b) 的 结论 推广 到 所 有 在 [0，1] 上 严格 单调 增 的 连续 分 布 函 
数 F. 

本 问题 以 一 价 拍卖 为 例 ， 解 释 如 何 将 显示 原理 (定理 4. 3) 推 广 到 贝 叶 斯 激 

励 相 容 机 制 ( 备 注 5.5) 中 。 

(a) 假设 在 估 值 分 布 为 F ，…，F, 的 一 价 拍卖 中 ， 竞 价 8i ，…，5, 为 一 个 
贝 叶 斯 -纳什 均衡 ， 即 与 问题 5. 3 类 似 。 证 明 存 在 一 个 单 物品 拍卖 M 
使 得 真实 竞价 是 一 个 贝 叶 斯 -纳什 均衡 ; 并 且 ， 对 于 每 个 估 值 组 合 v， 
M' 下 真实 竞价 得 到 的 结果 ， 和 一 价 拍卖 中 的 均衡 结果 相同 。 

b) 一 价 拍卖 是 “ 先 验 独立 ”的 ， 因 为 它 的 描述 和 竞拍 者 的 估 值 分 布 无 关 
( 见 6.4 节 ),， 那么 (a) 中 的 拍卖 M' 是 否 也 是 “ 先 验 独立 ”的 ? 
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上 一 章 介 绍 了 贝 叶 斯 单 参数 环境 下 的 期 望 收 益 最 大 化 拍卖 。 当 智能 体 的 估 值 不 再 
服从 同一 分 布 时 ， 最 优 机 制 就 会 变 得 相对 复杂 ， 需 要 更 多 关于 估 值 分 布 的 信息 ， 形 式 
上 也 不 会 像 实际 场景 中 所 使 用 的 拍卖 那样 简单 。 本 章 所 探究 的 是 近似 最 优 机 制 ， 它 比 
理论 上 的 最 优 机 制 更 简单 、 更 实用 ， 也 更 鲁 棒 。 

6. 1 节 解 释 了 简单 近似 最 优 拍 卖 。6. 2 节 介 绍 了 一 个 来 自 最 优 停止 理论 的 有 趣 结 
论 :“ 预 知 不 等 式 ”。6. 3 节 使 用 这 个 结论 设计 了 一 个 简单 且 可 证 明 的 近似 最 优 单 物品 
拍卖 。6.4 节 引 入 了 先 验 独 立 机 制 ， 即 这 个 机 制 的 描述 不 需要 参考 任何 估 值 分 布 的 信 
息 。6.4 节 还 证 明了 Bulow-Klemperer 定理 ， 它 解释 了 为 什么 竞争 比 信息 更 有 用 。 


6. 1 最 优 拍卖 可 能 很 复杂 


定理 5.4 表明 ， 在 单 参数 环境 下 ， 即 智能 体 的 估 值 相互 独立 且 服 从 正则 分 布 的 情 
况 下 ， 在 所 有 满足 DSIC 的 机 制 中 ， 虚 拟 福 利 最 大 化 机 制 能 够 最 大 化 期 望 收益 。 对 于 
每 个 估 值 组 合 vx， 虚拟 福利 最 大 化 机 制 要 求 


xo) = argmax >) pi(vi) zl v) 
i=l 


其 中 
1 — F; Cv) 
fC 





glu) = v; 


By HR ot AF: F 的 虚拟 估 值 。? 

5. 2. 6 节 内 容 表 明 ， 如 果 竞 拍 者 独立 同 分 布 于 一 个 正则 分 布 ， 最 优 单 物 品 拍卖 就 
会 非常 简单 : 就 是 一 个 简单 的 二 价 拍卖 ， 附 带 保 留 价格 pg '(0)。 这 就 是 拍卖 理论 中 一 
个 真正 的 “杀手 级 应 用 ”， 它 为 拍卖 设计 给 出 了 干净 利落 上 且 实用 的 指导 。 

但 如 果 问 题 再 复杂 一 点 就 不 会 这 么 明朗 了 。 比 如 ,仍然 考虑 单 物 品 拍卖 ,但 是 苋 
拍 者 的 估 值 独立 分 布 于 不 同 的 正则 分 布 。 那 么 最 优 拍 卖 就 会 变 得 有 点 怪 ， 某 些 性 质 就 
不 再 像 任 何 实 际 使 用 的 拍卖 形式 (练习 6.1)。 例 如 ， 除 竞价 最 高 的 竞拍 者 之 外 的 其 他 





加 ”因为 我 们 仅 考虑 满足 DSIC 的 机 制 ， 所 以 在 本 章节 中 都 假设 真实 竞价 ( 即 b= v) 
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人 也 可 能 赢得 拍卖 ; 如 果 不 参考 虚拟 估 值 ， 就 不 可 能 将 赢家 的 支付 解释 清楚 。 在 确切 
的 估 值 分 布 F，…，F, 下， 如 果 你 一 定 要 苛求 完美 的 最 大 期 望 收 益 的 话 ， 那 这 些 麻 
烦 就 难以 避免 。 

那么 是 否 存 在 更 加 简单 且 实 用 的 单 物品 拍卖 形式 ， 从 而 使 得 拍卖 至 少 是 近似 最 优 
fy WE? © 


6.2 预知 不 等 式 


考虑 以 下 有 个 阶段 的 游戏 。 在 阶段 ;， 你 可 以 获得 一 个 非 负 的 奖励 = ， 该 奖励 
服从 于 分 布 G,。 你 提前 知道 分 布 G ，…，G,， 并 且 这 些 分 布 相互 独立 。 你 还 知道 只 
有 在 阶段 i, zt 才 可 以 兑现 。 在 得 知 后 ， 你 要 么 选择 接受 奖励 然后 结束 游戏 ， 要 么 
AH LAIR IEA TB 次 策 的 困难 在 于 对 两 个 风险 的 权衡 ， 一 个 风险 是 由 
于 过 早 地 接受 一 个 合理 的 奖励 却 导 致 在 将 来 失去 一 个 更 大 的 奖励 ， 另 一 个 风险 是 拖 得 
Wo CTT ASTRON HIENA, 

神奇 的 “预知 不 等 式 ”给 出 了 一 个 简单 的 策略 ， 该 策略 几乎 能 够 像 先 知 一 样 取得 
很 好 的 奖励。 

定理 6. 1( 预 知 不 等 式 ) 对 于 每 个 元 素 都 服从 独立 分 布 的 序列 Gl ，…，G,， 存 在 
一 个 策略 能 够 保证 期 望 收益 至 少 是 吉 EeLmaxxi]。 男 外 ， 存 在 一 个 这 样 的 阅 值 策 


略 ， 当 且 仅 当 X; 至 少 达到 阅 值 1 时 才 接 受奖 励 i。 

证 明 : Se” 表示 max{z，0)。 考 虑 阔 值 为 上 的 阔 值 策略 。 直 接 比 较 这 个 策略 和 一 
nan 所 以 ， 我 们 转 而 推导 这 两 个 策略 收益 的 上 下 界 ， 这 就 
容易 得 多 了 。 

S g(i) 表 示 效 值 策略 不 接受 任何 奖励 的 概率 2 。 当 上 增加 时 ， 风 险 gq(z) 会 增加 ， 
但 是 奖励 的 期 望 值 也 在 提高 。 

六 阔 值 策略 会 获得 多 少 收 益 呢 ? 这 个 策略 有 ql) 的 概率 收益 为 0， 有 1 — aa) A 
率 收益 至 少 为 :。 现 在 让 我 们 想 办 法 提高 一 下 第 二 种 情况 的 收益 下 界 。 如 果 只 有 一 个 
奖励 i 满足 x; 宇 :， 那 么 我 们 就 可 以 不 止 得 到 基础 收益 上， 还 能 得 到 元 一 上 的 “额外 奖 
励 "。 如 果 至 少 两 个 奖励 超过 了 阅 值 ， 假 设 是 i 和 7 ， 就 变 得 复杂 了 : “额外 奖励 ”要 
么 是 x; 一 :， 要 么 是 xj; 一 +:， 判 断 依据 为 哪个 奖励 更 靠 前 就 是 哪个 。 我 们 偷懒 一 点 ， 当 
有 两 个 或 更 多 奖励 超过 阔 值 时 ， 只 把 : 当 作 阔 值 策略 的 收益 。 


O 本章 有 很 多 术语 像 “简单 ”“ 实 用 ”和 “和 鲁 棒 ” 都 没有 定义 。 这 和 我 们 在 算法 机 制 设计 中 遇 到 的 情况 
不 同 。 在 算法 机 制 设计 中 ， 我 们 使 用 近似 来 避免 由 完全 最 优 带 来 的 各 种 各 样 的 困难 (第 4 章 ); 在 那 
里 ,我 们 认为 “实用 ”就 是 “能 在 多 项 式 时 间 内 实现 ”。 

O ”请 注意 ， 放 弃 最 后 阶段 的 奖励 显然 是 次 优 的 ! 
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我 们 可 以 将 Ec [t~ BER ME Hii JE PP AES : 


qaet + JE, Lm: —tle; > tsr; < tY j AilPrle, > t]Prir, < tY jAi] 
i=1 





=(1—q(t))¢+ >) E[r: — tle; > Pri, > t] Prie; < tYj Fi] 
A =E; nt] SRN 
宇 (1 qat +4) EL — e+] (6.1) 
i=1 


在 (6.1) 式 中 我 们 利用 G; 的 独立 性 分 解 两 个 概率 ， 同 时 利用 独立 性 ， 对 于 每 个 GALE 
可 以 去 掉 x; <t 这 一 限制 条 件 。 此 外 我 们 还 利用 了 ga) = Prim <t Yj] 
Priaj<tVjFAil, RAIER. 1)。 

现在 我 们 求 先知 策略 的 期 望 回 报 E, [max xi] 的 上 界 ， 它 要 容易 和 式 (6. 1) 进 行 比 
BE. E Cmax r 门 的 表达 式 和 靖 值 1 无关， 所 以 加 一 个 减 一 个 上 得 到 : 


E,| max mı | = E,|: + max(x = D] 
i=l i=] 


<t+E,| maxx, —0* | 
i=] 


Zit Vin fie =o (6.2) 
比较 式 (6. 1) 和 式 (6. 2)， 我 们 可 以 设置 使 得 q(t) 二 1/2， 即 以 50% Oe AERC AE A 
证 毕 ,9 n 


备注 6. 2( 僵 局 下 的 保证 ) 6.1 节 的 证 明暗 含 着 一 个 更 强 的 命题 ， 这 个 命题 在 下 
一 节 中 会 很 有 用 处 。 当 两 个 或 两 个 以 上 的 奖励 超过 阅 值 1 时 ,二 阅 值 策略 的 收益 下 界 
(6.1) 仅 仅 计算 了 tt 个 单位 的 收益 。 注 意 ， 只 有 一 个 超过 阅 值 的 奖励 ， 对 式 (6. 1) 的 第 
二 项 一 一 “额外 奖励 ”产生 了 贡献 。 所 以 ， 当 有 多 个 奖励 超过 阅 值 时 ， 即 使 它 选 择 的 


奖励 是 最 小 的 那个 ， 这 个 策略 依然 能 够 保证 方术 [max xi] 的 收益 。 


6.3 简单 的 单 物品 拍卖 


现在 我 们 回 到 最 初 的 单 物品 拍卖 及 个 竞拍 者 ， 他 们 的 估 值 服从 不 同 的 正则 分 布 
下 ，…， 瑟 ,。 我 们 利用 预知 不 等 式 (定理 6.1) 来 设计 一 个 比较 简单 的 近似 最 优 拍 卖 。 

核心 思路 是 将 第 i 个 奖励 定义 为 竞拍 者 i 虚拟 估 值 的 正 部 yp;(v)”。 那 么 G 就 是 由 FF 
得 到 的 相应 分 布 ; 因为 是 相互 独立 的 ， 所 以 G; 也 是 相互 独立 的 。 为 了 看 到 这 个 拍卖 和 


日 ”如 果 由 于 各 个 G; 中 的 点 都 搅 在 一 起 ， 致 使 不 存在 这 样 的 :， 那么 只 需 对 这 个 证 明 进行 小 的 扩展 就 可 以 
得 到 相同 的 结果 (练习 6. 2) 。 
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预知 不 等 式 的 初步 联系 ， 我 们 可 以 利用 定理 5. 2 的 式 子 来 表示 最 优 拍卖 的 期 望 收益 : 


Er| Xyp 0a Cv) | = Es| max p(w) | 


1=1 


期 望 收 益 和 奖励 为 pi Ce) sets py Con)” 的 最 优 停止 游戏 中 先知 得 到 的 奖励 一 样 。 
现在 考虑 满足 以 下 形式 的 分 配 规 则 。 





虚拟 国 值 分 配 规则 


L 选择 +， 使 得 PrLmax pio) t S=F. © 


2. 如 果 有 竞拍 者 i NGC) 宇 t:， 就 将 物品 分 配给 i， 当 存在 多 个 这 样 的 竞拍 者 
时 ， 随 机 分 配给 任意 一 个 以 打破 僵局 。 








和 备注 6. 2 强调 的 一 样 ， 预 知 不 等 式 意味 着 上 述 分 配 规则 具有 以 下 的 性 质保 证 : 
引 理 6. 3( 虚 拟 阅 值 分 配 规 则 是 近似 最 优 的 ) 若是 一 个 虚拟 同 值 分 配 规 则 ， 则 
E| Dgo zi Co) | > FE, | max gi (0 | (6. 3) 
因为 虚拟 阔 值 分 配 规则 不 会 将 物品 分 配给 虚拟 估 值 为 负 的 竞拍 者 ， 所 以 式 (6. 3) 
左边 也 等 于 E.| > PIC) zw) | 9 


以 下 就 是 一 个 具体 的 虚拟 阔 值 分 配 规则 。 





带 “ 竞 拍 者 定向 ”保留 价 的 二 价 拍卖 
1. 给 每 个 竞拍 者 设置 特定 的 保留 价 x; 二 gi'(1)， 其 中 tt 和 虚拟 辣 值 分 配 规 则 中 的 t 
定义 相同 。 
2. 如 果 存 在 一 个 竞价 最 高 的 竞拍 者 ， 且 他 的 竞价 超过 保留 价 ， 就 将 物品 分 配 这 个 
竞拍 者 。 








这 个 拍卖 首先 利用 每 个 竞拍 者 特定 的 保留 价 过 滤 掉 一 些 竞拍 者 ， 然 后 将 物品 分 配 
给 剩余 竞拍 者 中 竞价 最 高 的 竞拍 者 。 当 估 值 分 布 是 正则 分 布 时 ， 这 个 分 配 规则 是 单调 
的 (练习 6. 3) 。 使 用 迈 尔 和 森 引 理 ， 这 个 分 配 规则 可 以 扩展 成 一 个 DSIC 拍卖 。 启 家 的 
支付 就 是 他 的 保留 价 和 除 他 之 外 竞价 超过 各 自 保留 价 的 最 高 竞价 中 的 较 大 者 。 由 定理 
5.2 和 引 理 6. 3 可 知 ， 在 所 有 DSIC 拍卖 中 ， 这 个 拍卖 能 够 将 期 望 收 益 近 似 最 大 化 。 

定理 6. 4( 简 单 拍卖 和 最 优 拍卖 ) 对 于 所 有 的 ?之 1 和 正则 分 布 Fi，…，F,， 有 





O 如果 不 存在 这 样 的 上 t， 请 参考 练习 6.2. 





合适 的 保留 价 的 二 价 拍卖 的 期 望 收益 至 少 是 最 优 拍卖 的 50%。 

对 于 许多 分 布 ，50% 的 保证 是 可 以 提高 的 ， 但 在 最 坏 的 情况 下 ，50% 的 保证 依然 
成 立 ， 即 使 只 有 两 个 竞拍 者 ( 详 见 问题 6. 1)。 

拥有 竞拍 者 定向 保留 价 的 二 价 拍卖 在 两 个 方面 比 最 优 拍卖 更 简单 。 第 一 ， 虚 拟 估 
值 函 数 只 是 用 来 设置 保留 价 。 第 二 ， 竞 价 最 高 的 竞拍 者 要 赢得 物品 ， 只 需要 竞价 超过 
他 自己 的 保留 价 。 

一 个 更 简单 的 拍卖 是 : 对 所 有 竞拍 者 使 用 一 个 公共 的 或 者 “隐藏 ”的 保留 价 。 例 
W, eBay 的 公开 竞拍 就 是 有 隐藏 保留 价 的 8 。 关 于 具有 隐藏 保留 价格 的 单 物 品 拍卖 的 
近似 保证 详 见 说 明 。 


6.4 先 验 独 立 机 制 


本 节 将 探讨 一 个 与 第 5 章 不 同 的 理论 模式 。 第 5 章 假 设 机 制 设计 者 知道 估 值 分 布 
Fi，…， 开 ,。 在 某 些 实际 场景 中 存在 大 量 的 数据 ， 且 竞拍 者 的 偏好 不 会 快速 变化 ， 
在 这 样 的 情况 下 ， 这 是 一 个 合理 的 假设 。 但是， 如 果 机 制 设计 者 不 知道 或 者 不 确定 估 
值 分 布 的 话 会 怎样 ? 这 个 问题 在 那些 没有 很 多 数据 的 稀 朴 市 场 8 是 经 常 出 现 的 ， 包 括 
那些 很 少 使 用 但 潜在 估 值 很 高 的 关键 字 搜 索 拍卖 (如 练习 5. 10) 。 

如 果 移 除 关 于 估 值 分 布 的 先 验 知识 ,我 们 可 能 会 回 到 5. 1. 2 节 的 困境 中 ， 即 运用 贝 
叶 斯 方法 导致 的 单 竞拍 者 单 物品 困境 。 不 同 之 处 在 于 ， 我 们 仍然 假设 竞拍 者 的 估 值 是 服 
从 概率 分 布 的 ; 只 是 机 制 设 计 者 不 知道 这 些 概 率 分 布 。 换 名 话说， 我 们 在 机 制 的 分 析 过 
程 中 继续 使 用 估 值 分 布 ， 但 在 机 制 的 设计 过 程 中 不 使 用 估 值 分 布 。 我 们 的 目标 就 是 设计 
一 个 良好 的 先 验 独 立 机 制 ， 即 机 制 的 表达 式 中 不 包含 估 值 分 布 的 信息 。 先 验 独 立 机 制 的 
例子 包括 单 物品 二 价 拍卖 和 更 一 般 的 福利 最 大 化 DSIC 机 制 ( 如 练习 4.1)。 反 例 包括 垄 
断 价格 ， 它 是 潜在 估 值 分 布 的 函数 ， 更 一 般 的 虚拟 福利 最 大 化 机 制 也 是 一 个 反例 。 

接 下 来 ,介绍 一 个 由 拍卖 理论 推导 出 的 优美 结论 : 最 优 单 物品 拍卖 的 期 望 收益 至 
多 和 多 一 个 竞拍 者 的 二 价 拍 卖 一 样 (无 保留 价 )。 

定理 6. 5(Bulow-Klemperer 定理 ) 假设 下 是 正则 分 布 , nn 是正 整 数 。 令 卫 表 示 
Antl 个 竞拍 者 的 二 价 拍 卖 的 支付 规则 ，p" 表示 有 nn 个 竞拍 者 的 最 优 拍 卖 (分 布 为 
玉 ) 的 支付 规则 号 。 则 


atl n 
E| Dao | > E| Sp Co) | (6.4) 
i=l i=1 





日 一 些 现实 应 用 的 拍卖 的 确 使 用 竞拍 者 定向 保留 价 。 例 如 ， 在 一 些 关 键 字 搜 索 拍 卖 中 ,， “高 品质 的 ” 广 
告 商 ( 由 搜索 公司 评估 ) 的 保留 价 比 “ 低 品质 的 ”广告 商 要 低 。 

稀 朴 市 场 的 英文 为 thin market， 也 译 为 薄 市 场 或 不 活跃 市 场 。 一 一 译 者 注 

后 一 个 拍卖 是 保留 价 为 gp-1(0) 的 二 价 拍 卖 , 其 中 og 是 F 的 虚拟 估 值 函数 ( 见 5. 2.6 节 )。 


® D 
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通常 关于 Bulow-Klemperer 定理 的 解释 是 : 更 多 的 竞争 比 选择 合适 的 拍卖 形式 更 
重要 ， 这 也 是 有 很 多 实际 例子 支撑 的 。 所 以 在 信息 来 源 上 投资 ， 使 拍卖 能 拥有 更 多 参 
与 者 ， 比 提高 对 参与 者 偏好 的 了 解 程度 更 好 。( 当 然 ， 能 同时 做 到 肯定 要 同时 做 到 !) 

Bulow-Klemperer 定理 让 人 感觉 到 : 对 于 单 物品 拍卖 情形 ， 在 所 有 竞拍 者 的 估 值 
独立 同 分 布 于 一 个 正则 分 布 时 ,〈 先 验 独 立 的 ) 二 价 拍卖 与 无 数 种 不 同 的 最 优 机 制 都 可 
以 匹敌 。 而 练习 6.4 表明 了 这 个 定理 的 另 一 个 结论 : 对 于 这 样 的 单 物 品 情境 ， 有 


1 之 2 个 竞拍 者 时 ， 二 价 拍卖 的 期 望 收益 至 少 是 最 优 拍卖 的 2 一 倍 。 问题 6.4 列 出 了 


Bulow-Klemperer 定理 的 更 多 扩展 和 变种 。 
定理 6.5 的 证 明 : 直接 比较 (6.4) 式 的 两 边 比 较 麻 烦 ， 为 了 更 好 地 分 析 ， 我 们 定义 
一 个 虚拟 的 拍卖 A 以 方便 比较 。 含 有 (2 十 1) 个 竞拍 者 的 单 物 品 DSIC 拍卖 过 程 如 下 : 











虚拟 拍卖 A 
ls HRM nh HHS ly 25 en Ms 模拟 一 个 最 优 拍卖 Fe 
2. 如 果 在 第 一 步 中 物品 没有 分 配 出 去 ， 那 么 就 免费 将 物品 分 配给 第 nt+1 个 竞拍 者 。 








我 们 定义 A 是 为 了 得 到 两 个 重要 的 性 质 。 第 一 个 是 ，A 的 期 望 收益 等 于 有 并 个 
竞拍 者 的 最 优 拍 卖 的 期 望 收益 ， 即 (6. 4) 的 右 部 。 第 二 个 是 ，A 总 是 能 够 将 物品 分 配 
出 去 。 

通过 论证 二 价 拍卖 (有 n+] 个 竞拍 者 ) 的 期 望 收益 至 少 是 A 的 期 望 收 益 ， 我们 就 可 
以 完成 证 明 。 为 此 我 们 展示 一 个 更 强 的 命题 ， 即 当 竞 拍 者 的 估 值 独立 同 分 布 于 一 个 正则 
分 布 时 ， 在 所 有 可 以 将 物品 分 配 出 去 的 DSIC 拍卖 中 ， 二 价 拍卖 的 期 望 收益 是 最 大 的 。 

我 们 可 以 使 用 5. 2 节 得 到 的 工具 来 分 析 二 价 拍卖 是 否 是 最 优 的 。 由 于 期 望 收益 和 
期 望 虚拟 福利 的 等 价 性 (定理 5. 2)， 所 以 最 大 化 后 者 就 足够 了 。 在 总 可 以 将 物品 分 配 
出 去 的 前 提 下 ， 最 大 化 期 望 福利 的 分 配 规则 总 是 会 将 物品 分 配给 虚拟 估 值 最 高 的 竞拍 
者 ， 即 使 他 的 虚拟 估 值 为 负 。 

注意 ， 二 价 拍卖 总 是 会 将 物品 分 配给 估 值 最 高 的 竞拍 者 。 又 因为 竞拍 者 的 估 值 独 
立 同 分 布 于 正则 分 布 ， 所 以 所 有 竞拍 者 的 虚拟 估 值 了 泡 数 都 是 相同 的 。 因 此 估 值 最 高 
的 竞拍 者 的 虚拟 估 值 也 是 最 大 的 。 总 结 一 下 ， 在 总 是 将 物品 分 配 出 去 的 前 提 下 ， 二 价 
拍卖 的 期 望 收益 总 是 最 大 的 ， 证 毕 。 m 


总 结 


o 当 竞 拍 者 的 估 值 服从 不 同 的 分 布 时 ， 最 优 单 物品 拍卖 很 复杂 ， 需 要 关于 估 值 
分 布 的 细节 信息 ， 而 这 和 实际 使 用 的 拍卖 形式 不 同 。 
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© 预知 不 等 式 表明 ， 给 定 一 系列 的 奖励 ， 且 奖励 服从 已 知 的 独立 分 布 时 ， 存 在 
一 个 阔 值 策略 ， 使 得 期 望 收益 至 少 是 最 大 奖励 期 望 值 的 50%。 

© 预知 不 等 式 意味 着 ， 通 过 选择 合适 的 竞拍 者 定向 保留 价 ， 可 以 使 二 价 拍卖 的 
期 望 收益 至 少 是 可 能 最 大 值 的 50%。 

o 先 验 独 立 机 制 是 那些 表达 式 中 不 含有 任何 估 值 分 布 信息 的 机 制 。 最 大 化 福利 
机 制 是 先 验 独立 的 ;而 最 大 化 虚拟 福利 机 制 不 是 先 验 独立 的 。 

è Bulow-Klemperer 定理 表明 ， 最 优 单 物品 拍卖 的 期 望 收益 至 多 和 多 一 个 竞拍 者 
的 二 价 拍卖 一 样 。 


说 明 


预知 不 等 式 ( 定 理 6.1) 源 于 Samuel-Cahn(1984)。 定 理 6.4 来 自 于 Chawla 等 
(2007)。 有 隐藏 保留 价 的 二 价 拍卖 的 近似 率 保证 由 Hartline 和 Roughgarden(2009) 首 
先 研究 ， 最 近 Alaei 等 (2015) 的 成 果 表 明 ， 这 样 的 拍卖 总 是 可 以 有 最 优 拍卖 至 少 
1/e 过 37% 的 期 望 收益 。 问 题 6. 2 在 Hartline 和 Roughgarden(2009) 中 也 出 现 了 。 问 
题 6. 3 的 结果 源 自 Chawla 等 (2010)。 

Bulow-Klemperer 定理 (定理 6.5) 和 问题 6. 4a 中 的 应 用 来 自 于 Bulow 和 Klem- 
perer(1996)。 我 们 的 证 明 来 自 Kirkegaard (2006)。Roughgarden 和 Sundararajan 
(2007) 关 注 了 近似 保证 (练习 6.4)。 设 计 优 良 先 验 独 立 机 制 的 一 般 方法 是 由 Dhang- 
watnotai 等 (2015) 描 述 清楚 的 ， 问 题 6. 4b 是 他 们 “ 单 样品 ”机 制 的 特例 。 正 如 Gold- 
berg 等 (2006) 所 提出 的 那样 ， 先 验 独 立 机 制 设 计 可 以 看 作 是 放松 “无 先 验 ”条 件 的 
一 般 机 制 设计 。 

同 第 5 章 提出 的 经 典 最 优 拍 卖 理论 不 同 的 是 ， 简 单 近似 最 优 机 制 和 先 验 独立 机 制 
是 最 近 10 年 才 出 现 的 ， 且 主要 是 在 计算 机 科学 领域 。 详 见 Hartline(2016) 关 于 最 近 
研究 进展 的 调查 。 


练习 


练习 6.1 考虑 有 个 竞拍 者 的 单 物品 拍卖 ,竞拍 者 的 估 值 独立 分 布 于 正则 分 布 
Fi, «+, Foo 
(a) 以 竞拍 者 虚拟 估 值 函数 的 形式 ， 给 出 最 优 拍卖 赢家 的 支付 公式 。 
(b) (H) 举 例 说 明 ， 最 优 拍卖 中 竞价 最 高 的 竞拍 者 未 必 会 赢 ， 即 使 他 的 虚 
拟 估 值 为 正 。 
(c) 给 出 一 个 直观 的 解释 : 为 什么 (b) 中 的 性 质 对 增加 拍卖 的 期 望 收益 有 益 ? 
练习 6.2 (也 ) 将 预知 不 等 式 ( 定 理 6. DH he BA FEE A t 满足 q(t) 二 1/2 的 情形 ， 


练习 6.3 


练习 6. 4 


问题 


问题 6. 1 


问题 6. 2 
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其 中 q(t) ARA K E E EE 

证 明 当 估 值 分 布 为 正则 分 布局 eo FAS. A Et E m RB Ot (6. 3 节 ) 
的 二 价 拍卖 的 分 配 规则 是 单调 的 。 

CH) 考 虑 有 个 竞拍 者 的 单 物品 拍卖 ， 竞 拍 者 的 估 值 独立 同 分 布 于 一 个 正 
则 分 布 下。 证 明 二 价 拍卖 (无 保留 价 ) 的 期 望 收 益 至 少 是 最 优 拍卖 的 
(n—1)/n 4%. 


这 个 问题 研究 了 对 预知 不 等 式 (定理 6.1) 的 改进 ， 以 及 它 对 于 简单 近似 最 

优 拍卖 (定理 6.4) 的 重要 作用 。 

(a) CH) 说明 在 预知 不 等 式 中 1/2 很 难 再 提高 : 对 于 任意 一 个 常数 1/2, 
都 存在 分 布 G, ，… ，G@, 使 得 每 种 策略 (无 论 是 否 是 阔 值 策略 ) 的 期 望 收 
益 小 于 ec。 下 一 c[max mile 

(b) 证 明定 理 6. 4 在 50% 被 换 成 任何 更 大 的 数 的 情况 下 都 不 再 成 立 。 

(c) 预知 不 等 式 中 的 1/2 能 否 在 一 些 特例 中 被 提高 ; 比如 估 值 独立 同 分 布 
FG, =G =G? 

这 个 问题 来 自 一 个 关于 简单 近似 最 优 拍卖 的 通用 的 结论 。 考 虑 单 参数 环境 

中 ， 每 个 可 行 的 结果 都 是 一 个 0-1 向 量 ， 它 指定 了 赢得 物品 的 智能 体 ( 比 

照 练 习 4. 2)。 假 设 可 行 集合 是 向 下 封闭 的 ， 即 如 果 S 是 赢得 物品 的 智能 体 

MATH. TOS, 那么 本 也 是 赢得 物品 的 智能 体 的 可 行 集 。 最 后 ,假设 


每 一 个 智能 体 i 的 估 值 分 布 F, 都 满足 风险 率 单调 (练习 5.4)， 即 一 2 


1—F,(v) 
关于 vw; 是 非 减 函数 。 
用 AM 表示 最 大 化 期 望 收 益 的 DSIC 机 制 。 我们 的 “主角 ”是 下 面 这 个 
DSIC 机 制 M. 











具有 龙 断 保留 价 的 福利 最 大 化 机 制 
1. 设 六 是 分 布 Fi 下 的 垄断 价格 ( 即 属于 argmax{7 + 人 一 有 Cr。 
令 S 表 示 满 足 v; 宇 ri; 的 智能 体 集合 。 
3. 选择 赢家 集合 WCS 以 最 大 化 社会 福利 : 
W = argmax  \v; 


TES:T 可 行 ieT 


4. 根据 迈 尔 森 支 付 公 式 (3.5) 定 义 支付 。 


p 
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问题 6. 3 


问题 6. 4 


ROE 





(a) 令 g; 表 示 F; 下 的 虚拟 估 值 函数 。 利 用 风险 率 单调 条 件 证 明 : 对 于 任意 
yer, HAr, +¢,(v,)>v;. 

(b) CH) GER M 的 期 望 社会 福利 至 少 和 M 一样。 

Cc) CH) 证 明 M 的 期 望 收益 至 少 是 其 期 望 社会 福利 的 一 半 。 

Cd) 总 结 出 M 的 期 望 收益 至 少 是 最 优 机 制 AM "的 一 半 。 

考虑 单个 顾客 只 购买 n 个 不 同 物品 中 至 多 一 个 的 情况 。 假 设 顾 客 对 这 个 


物品 的 私人 估 值 w ，…，vw, 服 从 已 知 的 独立 正则 分 布 F,，…，F,。 需 要 设 
计 的 机 制 空 间 是 牌价 的 集合 ， 一 个 物品 一 个 牌价 。 当 牌价 是 o p 


时 ， 若 对 于 每 个 物品 j ， 都 有 方 二 几 ， 顾 客 就 不 选择 任何 物品 。 和 否则 的 话 ， 

他 就 选择 能 够 最 大 化 v; 一 pb; 的 那个 物品 ， 并 支付 pj 给 卖家 。 阁 出 现 多 个 这 

样 的 物品 ， 就 从 中 任意 选择 一 个 打破 僵局 。 

(a) 解释 为 什么 这 个 设 定 不 符合 单 参数 环境 。 

Cb) (HD) 证 明 : 对 于 每 个 ，…，F,， 通 过 牌价 得 到 的 最 大 期 望 收益 至 多 
和 有 个 竞拍 者 的 最 优 单 物品 拍卖 的 最 大 期 望 收益 相同 ， 其 中 个 竞 
拍 者 的 估 值 服从 相互 独立 的 分 布 F，…，FF,。 

C) (HER: 对 于 每 个 局 ，…，F,， 存 在 这 样 的 牌价 ， 它 能 获得 的 期 望 
收益 至 少 是 (b) 中 所 述 上 界 的 一 半 。 

这 个 问题 考虑 了 Bulow-Klemperer 定理 (定理 6.5) 的 一 些 变种 。 考 虑 一 个 

n 竞拍 者 k 物品 的 拍卖 (例子 3.2)， 其 中 n 宇 k 宇 1， 且 竞拍 者 的 估 值 独立 同 

分 布 于 正则 分 布 下。 

(a) 证 明 分 布 为 下 的 最 优 拍卖 的 期 望 收益 (练习 5.7) 至 多 和 额外 多 k 个 竞 
拍 者 的 最 大 化 福利 的 DSCI 拍卖 一 样 ( 练 习 2. 3) 。 

Cb) CH) {RE 2 人 t+1。 证 明 下 面 的 随机 拍卖 满足 DSIC， 而 且 它 的 期 望 收 


益 至 少 是 最 优 拍卖 的 号 一 售 。 








一 个 先 验 独立 拍卖 
L 按照 均匀 分 布 随机 地 选择 一 个 竞拍 者 j。 
2. 令 S 表 示 除 7 之 外 竞价 前 k& 高 的 竞拍 者 集合 ,4 表示 接 下 来 竞价 最 高 
的 竞拍 者 。( 如 果 ?一 A 一 1， 则 定义 必 为 0) 
3. 以 max{v;，vi} 的 价格 将 物品 分 配给 S Pe — Hv, Su, HF 7. 

















O ” 当 满 足以 下 条 件 时 ， 我 们 称 随机 拍卖 是 满足 DSIC 的 : 如 果 对 于 每 个 智能 体 i 和 系统 收 到 的 其 他 智能 
体 上 报 的 估 值 y-;， 真 实地 上 报 自己 的 估 值 能 够 最 大 化 i 的 期 望 效 用 ， 期望 是 基于 机 制 自身 的 随机 操 
作 计算 得 到 的 。 
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第 2 一 6 章 只 考虑 了 单 参数 环境 下 的 机 制 设计 问题 ， 即 智能 体 的 唯一 私人 参数 是 
他 对 某 个 单位 数量 事物 的 估 值 。 针 对 多 参数 的 问题 ， 即 每 个 智能 体 都 有 多 个 私人 参数 
时 ， 机 制 设计 就 困难 多 了 。 不 过 ，Vickrey-Clarke-Grove(VCG) 机 制 提 供 了 一 个 具有 
良好 泛 化 能 力 的 结论 : 原则 上 ， 在 任意 多 参数 环境 下 ， 最 大 化 福利 的 DSIC 机 制 是 可 
以 实现 的 。 

7.1 节 正式 定义 一 般 化 的 机 制 设 计 环 境 。7.2 节 引 入 VCG 机 制 并 且 证 明 它 是 
DSIC 的 。7. 3 节 讨 论 实 际 运行 VCG 机 制 时 遇 到 的 挑战 。 


7.1 一 般 化 的 机 制 设计 环境 


一 般 化 的 多 参数 机 制 设 计 环境 由 以 下 部 分 组 成 : 

o n 个 策略 型 的 参与 者 ， 或 者 叫 作 智能 体 ; 

e 一 个 结果 的 有 限 集 OQ; 

o 每 个 智能 体 i 对 每 个 结果 wEQ 都 有 一 个 非 负 的 私人 估 值 vi lw) o 

结果 集合 Q 是 抽象 的 ， 而 且 可 能 会 很 大 。 一 个 结果 wE2 的 社会 福利 可 以 定义 为 


Sata $ 
i= 


例 7. 1( 再 谈 单 物品 拍卖 ) 在 单 物品 拍卖 中 ，Q 只 含有 nn 十 1 AAR, BAAR 
对 应 一 个 可 能 赢得 物品 的 赢家 (如 果 存 在 的 话 )。 在 单 物 品 拍卖 的 标准 单 参数 模型 中 ， 
我 们 假设 竟 拍 者 对 他 没有 赢得 物品 的 元 个 结果 的 估 值 都 为 0， 这 样 每 个 竞拍 者 就 只 剩 
下 一 个 未 知 的 参数 。 而 在 更 加 一 般 化 的 多 参数 环境 中 ， 竞 拍 者 可 以 对 每 个 可 能 的 拍卖 
结果 都 有 不 同 的 估 值 。 例 如 ， 在 对 一 个 热门 创业 公司 的 竞 购 战 中 ， 如 果 一 个 竞拍 者 输 
了 ， 他 可 能 更 希望 来 自 于 其 他 市 场 的 公司 收购 这 家 创业 公司 ,而 不 是 被 自己 的 直接 竞 
争 者 收购 。 

例 7.2( 组 合拍 卖 ) 在 组 合拍 卖 中 ， 有 多 个 物品 出 售 ， 每 个 物品 不 可 再 切 分 。 竞 
拍 者 对 不 同 物品 子 集 ( 叫 作 捆绑 组 合 ) 的 偏好 可 能 很 复杂 。 假 定 有 nn 个 竞拍 者 、m 个 物 
品 的 集合 MM， 结果 集合 Q 中 的 元 素 对 应 n 维 向 量 (SI，…，S,)， 其 中 SICGM 表示 分 
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配给 竞拍 者 i 的 捆绑 组 合 ， 且 任何 物品 都 不 能 分 配 两 次 。 那 么 一 共有 (n 十 1)” 种 不 同 
的 结果 。 每 个 竞拍 者 i 对 他 可 能 得 到 的 每 种 捆绑 组 合 SOM 都 有 一 个 估 值 v,(S)。 因 
此 ， 每 个 竞拍 者 都 有 2” 个 私人 参数 。 

组 合拍 卖 在 实际 运用 中 很 重要 。 世 界 上 很 多 政府 举行 的 频谱 拍卖 已 经 产生 了 数 千 
亿美 元 的 收益 。 在 这 种 拍卖 中 ， 竟 拍 者 一 般 都 是 诸如 Verizon 或 者 AT&T 的 电信 公 
司 ， 拍 卖 物 品 则 是 在 某 个 地 区 内 一 定 频段 上 进行 广播 的 许可 证 。 组 合拍 卖 在 其 他 场景 
中 也 会 被 使 用 ， 比 如 在 机 场 分 配 起 降 时 段 等 。 


7.2 VCG 机 制 


接 下 来 介绍 的 结论 是 机 制 设 计 理 论 的 支柱 之 一 ， 也 是 这 个 领域 最 具 影 响 力 的 积极 
成 果 之 一 : 在 任意 多 参数 环境 下 ， 都 存在 一 个 福利 最 大 化 的 DSIC 机 制 。 

定理 7. 3( 多 参数 最 大 化 福利 机 制 ) 在 任意 的 一 般 化 的 机 制 设 计 环 境 中 ， 都 存在 
一 个 福利 最 大 化 的 DSIC 机 制 。 

回忆 定理 2.4， 我 们 以 二 价 拍卖 为 背景 列 出 了 理想 机 制 的 三 个 性 质 。 定 理 7. 3 同 
样 满足 前 两 个 性 质 (DSIC 和 社会 福利 最 大 化 )， 但 不 满足 第 三 个 性 质 ( 计 算 高 效 ) 。 从 
4.1.4 节 我 们 已 经 知道 ， 即 使 是 在 单 参数 环境 下 ， 也 不 存在 总 是 同时 满足 第 二 和 第 三 
个 性 质 的 机 制 ( 除 非 了 = 二 NP)。 因 此 我 们 会 发 现 定 理 7. 3 所 确定 的 机 制 在 许多 重要 的 
实际 应 用 中 ， 效 果 很 不 理想 。 

在 正式 证 明定 理 7. 3 之 前 , 我 们 先 讨 论 一 下 它 背 后 的 主要 思想 。 首 先 ， 设 计 一 个 
(直接 显示 )DSIC 机 制 是 比较 麻烦 的 ， 因 为 需要 将 分 配 规则 和 支付 规则 仔细 地 进行 结 
合 ?。 在 单 参数 环境 下 ， 我们 使 用 两 阶段 式 的 方法 设计 分 配 规 则 和 支付 规则 ， 效 果 很 
好 ， 所 以 现在 使 用 同样 的 方法 来 设计 它们 。 

第 一 步 ， 假 设 智能 体 真实 上 报 他 们 的 私人 估 值 ， 然 后 确定 应 该 选择 哪个 分 配 结 
果 。 由 于 定理 7. 3 要 求 最 大 化 福利 ， 所 以 唯一 的 方法 就 是 : 用 竞价 代替 估 值 ， 然 后 选 
择 那个 能 最 大 化 福利 的 结果 。 也 就 是 说 ， 给 定 竞 价 户 ，…， b, HP b WO 上 产生 
的 一 个 向 量 ， 我们 定义 分 配 规则 x 为 : 


x(b) = argmax >) 6,(@) CF dl) 
wen $2] 


第 二 步 ， 在 这 样 的 分 配 规则 下 ， 再 定义 一 个 支付 规则 ， 两 者 组 合成 为 一 个 DSIC 
机 制 。 上 一 次 面 对 这 个 问题 是 在 单 参数 环境 下 (3. 3 节 )， 在 那里 我 们 找 出 并 证 明了 迈 
尔 森 引 理 ( 定 理 3.7)， 这 是 一 个 在 单 参数 环境 下 通用 的 解法 。 但 当 环 境 不 再 是 单 参数 





O 显示 原理 的 描述 和 证 明 (定理 4.3) 可 以 直接 扩展 到 一 般 化 的 机 制 设计 环境 中 ,所 以 我 们 可 以 不 失 一 般 
性 地 将 注意 力 集中 到 直接 显示 机 制 上 来 。 
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时 ， 迈 尔 森 引 理 就 不 成 立 了 。 如 果 每 个 智能 体 都 提交 多 维 的 报告 ， 我 们 甚至 对 如 何 定 
义 分 配 的 单调 性 都 不 清楚 (比照 定义 3.6)S。 类 似 地 ， 对 于 0-1 单 参数 问题 ， 满 足 
DSIC 的 支付 规则 都 存在 一 个 “关键 竞价 ”性 质 (4.1.3 节 )， 但 多 参数 环境 下 分 配 规 
则 没有 一 个 明显 与 之 类 似 的 性 质 。 

现在 的 关键 是 ， 在 一 个 福利 最 大 化 的 DSIC 机 制 中 ,我 们 如 何 找 出 智能 体 i 支付 
规则 的 刻画 。 实 际 上 ， 我 们 可 以 用 i 引起 的 外 部 性 来 刻画 i 的 支付 ， 即 i 的 出 现 对 其 
他 一 1 个 智能 体 造成 的 损失 (练习 4.2)。 例 如 ， 在 单 物品 拍卖 中 ， 赢 得 物品 的 竞拍 
者 对 其 他 竞拍 者 造成 的 福利 损失 等 于 第 二 高 的 竞价 (假定 竞拍 者 都 真实 竞价 ) ， 而 这 人 恰 
好 就 是 二 价 拍卖 的 支付 规则 。“ 智 能 体 支 付 他 的 外 部 性 ”在 一 般 化 机 制 设计 环境 中 依 
然 有 很 好 的 定义 ， 其 对 应 到 支付 规则 就 是 


pi(b) = (max 976, ()) 一 Db ) (7.2) 





i% 65 ies 
其 中 “二 x(b) 是 式 (7.1) 选 出 的 结果 。 直 观 上 ,这样 的 支付 规则 迫使 智能 体 将 由 他 
引起 的 外 部 性 内 部 化 ， 从 而 使 得 其 动机 与 决策 者 的 动机 相 一 致 。 需 要 注意 的 是 ， 支 付 
pi(b) 至 少 为 0( 练 习 7.1). 

定义 7. 4(VCG 机 制 ) ”分配 规则 和 支付 规则 分 别 如 式 (7.1) 和 式 (7.2) 的 机 制 (x， 
p)™ 4 Vickrey-Clarke-Grove 或 VCG 机 制 。 

下 面 给 出 VCG 机 制 支付 规则 的 另 一 种 解释 ， 重 写 式 (7. 2) 为 : 





(D = hw] j= b,(@) | l 
pi(b) = bo 2,0% ) ma Zbyt) (7. 8) 
at 


il 

据 此 我 们 可 以 将 智能 体 i 的 支付 视 为 他 的 竞价 减 去 一 部 分 “ 退 款 ”"， 这 部 分 退 款 等 于 
因为 i 的 存在 而 产生 的 福利 增 量 。 例 如 ， 二 价 拍卖 中 ， 竞 价 最 高 的 竞拍 者 的 支付 为 他 
的 竞价 by MEBER bib: (bo 是 次 高 竞价 )， 这 也 等 于 该 竞拍 者 为 系统 带 来 的 福利 增 
量 。 注 意 ， 假 定 竞价 非 负 的 情况 下 ， 式 (7. 3) 中 的 退 款 也 是 非 负 的 (练习 7.1)。 这 也 
意味 着 pi (bD)<b)(@*  )， 因 此 如 实 报价 总 是 能 够 保证 效用 非 负 。 

定理 7. 3 的 证 明 : 选 定 任意 一 般 化 的 机 制 设 计 环 境 ， 令 (Cx，P) 表 示 相 应 的 VCG 
机 制 。 根 据 定义 ， 只 要 所 有 竞价 都 是 真实 的 ， 这 个 机 制 就 能 最 大 化 社会 福利 。 为 了 验 
证 DSIC 条 件 ( 定 义 2.3)， 我 们 只 需要 证 明 对 于 每 个 智能 体 ; 和 每 一 组 其 他 智能 体 的 
竞价 b_;， 智 能 体 i 都 能 够 通过 设置 b; 二 vw, 来 最 大 化 他 的 拟 线性 效用 vi (x (b)) — 
pi(b). 





日 ”可 实施 的 多 参数 分 配 规则 的 充 要 条 件 是 “ 环 单调 性 ”; 详 见 说 明 。 这 个 结果 很 优美 ， 它 可 以 类 比 于 如 
下 事实 : 一 个 边 权 为 实数 的 图 当 且 仅 当 它 不 包含 负 圈 时 ， 才 存在 一 个 定义 明确 的 最 短路 径 。 环 单调 
性 比 单 参数 环境 下 的 单调 性 难 用 得 多 。 由 于 要 验证 一 个 分 配 规则 是 否 满足 环 单调 性 很 困难 ， 所 以 很 
少 用 环 单调 性 来 判断 分 配 规则 是 否 可 实施 ， 也 很 少 在 实际 场景 中 用 它 来 推导 满足 DSIC 的 支付 规则 。 








固定 i 和 4b-;， 当 选中 的 x(b) 是 w* 时 ,我 们 可 以 利用 (7.2) 式 将 i 的 效用 写成 


vi(@" )— pi(b) = [alo ) + Db (0 J = | max Do; o | 
Zi “En FZ; 








CA) tB) 


B 项 是 一 个 常数 ， 和 i 的 竞价 b; 无 关 。 因 此 ， 最 大 化 i 的 效用 问题 就 退化 为 最 大 化 A 
项 的 问题 。 假 设 智能 体 ; 可 以 直接 选择 结果 wm"， 而 不 需 间 接地 通过 竞价 b; 来 影响 最 
终 的 结果 ， 那 么 智能 体 i 当然 会 选择 一 个 能 最 大 化 A 项 的 结果 。 现 在 ， 如 果 智 能 体 i 
Hb =v,, 那么 机 制 要 最 大 化 的 式 (7.1) 就 和 智能 体 要 最 大 化 的 A 项 一 致 了 。 因 
此 ， 真 实 竞价 可 以 “诱导 ”机 制 去 选择 能 最 大 化 智能 体 i 的 效用 的 结果 ， 而 任何 其 他 
报价 都 不 能 比 这 做 得 更 好 。 加 


7.3 实际 的 考量 


定理 7. 3 表明 ,在 一 般 化 的 多 参数 环境 中 ， 福 利 最 大 化 的 DSIC 机 制 总 是 可 能 实 
现 的 。 但 是 ， 在 大 多 数 多 参数 环境 中 ,运行 VCG 机 制 存 在 一 些 障碍 .” 

运行 VCG 机 制 的 第 一 个 挑战 叫 作 偏好 获取 ， 即 从 智能 体 处 获得 竞价 bis eo bno 
例如 ,在 有 mm 个 物品 的 组 合拍 卖 中 ( 例 7.2)， 每 个 竞拍 者 都 有 2” 个 私人 参数 ， 当 
m=10 时 ， 私 人 参数 是 1000 量 级 ， 当 m=20 时 就 是 百 万 量 级 。 没 有 任何 一 个 竞拍 者 
愿意 记 住 这 么 多 数字 。 类 似 的 问题 出 现在 所 有 直接 显示 机 制 中 ， 而 不 仅仅 是 VCG 机 
制 ， 因 为 它们 都 具有 巨大 的 结果 空间 。 

第 二 个 挑战 和 算法 机 制 设 计 中 的 一 个 挑战 类 似 ( 见 第 4 章 )。 即 便 第 一 个 挑战 不 是 
问题 ， 即 使 偏好 获取 能 很 容易 被 解决 ， 福 利 最 大 化 在 时 间 复 杂 度 上 也 可 能 是 计算 困难 
的 。 这 个 问题 其 实在 ( 单 参数 环境 ) 背 包 拍卖 (4. 1.4 节 ) 中 就 已 经 出 现 了 ， 在 更 复杂 的 
设 定 下 ， 即 使 是 近似 福利 最 大 化 ， 在 时 间 复 杂 度 上 都 可 能 难以 实现 。 

第 三 个 挑战 是 ， 即 使 实际 应 用 中 不 存在 前 两 个 挑战 ，VCG 机 制 的 收益 和 激励 也 可 
能 表现 不 好 (尽管 它 是 满足 DSIC 的 )。 例 如 ， 考 虑 两 个 物品 和 两 个 竞拍 者 的 组 合拍 卖 ， 
物品 为 A 和 B。 第 一 个 竞拍 者 只 想 同时 赢得 A 和 B， 即 vw(AB) 二 1， 其 他 情况 都 为 0。 
第 二 个 竞拍 者 只 想 赢得 物品 A， 即 wu (AB)=v (A) 二 1， 其 他 情况 都 为 0。 在 这 个 例子 
H, VCG 机 制 的 收益 就 是 1。 现在 假设 增加 第 三 个 竞拍 者 ， 只 想 赢 得 物品 B， 即 
vs(AB) 二 v;(B) 二 1。 现 在 最 大 福利 就 变 为 了 2, 但 是 VCG 机 制 的 收益 却 减 少 到 了 0( 练 
37.2! 在 实际 应 用 中 ， 由 于 收益 可 能 为 0 的 性 质 ，VCG 机 制 在 竞争 较 强 的 环境 中 很 
容易 出 现 毁 约 的 情况 。 另 外 ， 这 个 例子 中 收益 呈现 出 非 单调 的 性 质 ， 这 会 导致 更 多 激励 
问题 ， 比 如 机 制 面 对 合谋 和 假名 竞价 时 会 很 脆弱 (练习 7.3 和 7.4)。 


O VCG 机 制 仍然 可 以 作为 其 他 更 实用 方法 的 有 效 基准 参考 (比照 第 6 章 )。 
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下 一 章 将 讨论 如 何在 现实 的 组 合拍 卖 中 应 对 这 些 挑 战 。 


总 结 


o 在 一 般 化 机 制 设计 环境 中 ， 智 能 体 对 每 种 可 能 的 结果 都 有 一 个 私人 估 值 。 组 
合拍 卖 是 此 类 环境 中 一 个 在 理论 和 应 用 上 都 很 重要 的 案例 。 

在 VCG 机 制 中 ， 分 配 规则 根据 智能 体 的 竞价 来 选择 社会 福利 最 大 化 的 结果 ， 
支付 规则 为 每 个 智能 体 都 支付 其 外 部 性 ， 即 由 于 他 的 存在 而 对 其 他 智能 体 造 
成 的 福利 损失 。 

每 个 VCG 机 制 都 是 满足 DSIC 的 。 

VCG 机 制 在 实际 运用 中 存在 一 些 问题 ， 包 括 难以 获取 大 量 私 人 参数 、 福 利 最 
大 化 结果 计算 困难 ， 以 及 较 差 的 收益 和 激励 。 


说 明 


VCG 机 制 的 定义 来 自 于 Clarke(1997)， 它 将 Vickrey(1961) 中 提出 的 单 物品 次 价 
拍卖 进行 了 一 般 化 。Groves(1973) 给 出 了 更 加 一 般 化 的 机 制 ， 其 中 每 个 智能 体 的 支付 
规则 都 增加 了 一 个 独立 于 竞价 的 “关键 项 ”h,(b_;)( 详 见 问题 7.1) 。 在 多 参数 环境 
中 ,分配 规则 的 可 实施 性 的 等 价 条 件 及 其 “ 环 单调 性 ”来 自 于 Rochet(1987); Vohra 
(2011) 给 出 了 上 述 理论 的 清楚 阐述 及 应 用 。Rothkopf 等 (1990) 及 Ausubel 和 Mil- 
grom(2006) 详 细 说 明了 实际 执行 VCG 机 制 时 面临 的 许多 挑战 。 问 题 7.1 来 自 Holm- 
storm(1977)。 问 题 7.3 来 自 Dobzinski 等 (2010); 同样 类 型 的 更 多 结果 可 以 参见 
Blumrosen 和 Nisan(2007)。 


练习 


练习 7.1 证 明 VCG 机 制 中 智能 体 i 的 支付 p;(b) 至 少 是 0， 至 多 是 b,(w" )， 其 中 
wm “为 机 制 选择 的 最 终结 果 。 

练习 7.2 考虑 有 三 个 竞拍 者 两 个 物品 A 和 B 的 组 合拍 卖 ( 例 7.2)。 第 一 个 竞拍 者 只 
对 同时 赢得 两 个 物品 有 估 值 1( 即 vw,(AB) 二 1)， 其 他 情况 均 为 0。 第 二 个 
竞拍 者 只 对 赢得 物品 A AAA 1( 即 v,(AB)= 二 vw,(A) 二 1)， 其 他 情况 均 为 
0。 第 三 个 竞拍 者 只 对 赢得 物品 B 有 估 值 1， 其 他 情况 均 为 0。 
(a) 分 别 计 算 只 有 前 两 个 竞拍 者 时 和 三 个 竞拍 者 全 在 时 VCG 机 制 的 结果 。 

另外 ， 你 能 归纳 总 结 出 什么 ? 

Cb) 增加 一 个 竞拍 者 会 减少 单 物品 二 价 拍卖 的 收益 吗 ? 
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练习 7. 3 


练习 7. 4 


练习 7.5 


问题 


问题 7. 1 


给 出 一 个 组 合拍 卖 和 一 组 竞拍 者 估 值 ， 使 得 VCG 机 制 有 以 下 性 质 : 当 所 

有 竞拍 者 都 真实 竞价 时 ， 有 两 个 竞拍 者 得 不 到 任何 物品 ,但 是 他 们 可 以 通 

过 同时 虚报 竞价 ， 获 得 正 的 效用 (假设 其 他 竞拍 者 还 是 真实 竞价 ) 。 思 考 为 

什么 这 个 例子 不 违反 定理 7. 3? 

考虑 一 个 组 合拍 卖 ， 其 中 竞拍 者 可 以 用 不 同 的 名 字 提 交 多 个 竞价 ， 而 机 制 

设计 者 并 不 知道 这 个 情况 。 竞 拍 者 的 分 配 和 支付 是 他 所 有 假名 下 对 应 的 分 

配 和 支付 之 和 。 

(a) 给 出 一 个 组 合拍 卖 和 一 组 竞拍 者 佑 值 ， 使 得 : 在 VCG 机 制 中 ， 存 在 
一 个 竞拍 者 可 以 通过 提交 多 个 竞价 获得 比 作为 一 个 单独 智能 体 真实 区 
价 更 高 的 效用 。 (假定 其 他 竞拍 者 都 真实 竞价 ) 

Ch) 在 单 物 品 二 价 拍卖 中 这 种 情况 可 能 发 生 吗 ? 

(HH) 如 果 组 合拍 卖 中 竞拍 者 i 对 每 个 物品 都 有 一 个 参数 vas o Uno HEX 

于 每 个 物品 的 捆绑 组 合 S, ¥(S)= max vy (H. 1 (Q)=0). BLA AY FEF 

者 拥有 单位 需求 估 值 。 一 个 有 单位 需求 佑 值 的 竞拍 者 只 想 要 一 个 物品 ， 比 如 

某 个 特定 晚上 的 一 个 酒店 房间 ， 只 要 捆绑 组 合 中 有 他 最 想 要 的 物品 即 可 。 

给 出 一 个 该 场景 下 VCG 机 制 的 具体 实现 ， 要 求 机 制 的 运行 时 间 是 竞拍 者 数 

量 和 物品 数量 的 多 项 式 级 。 


考虑 一 般 化 的 机 制 设 计 环境 ， 其 结果 集 为 2， 智 能 体 数目 为 凡 。 在 本 问题 
中 ， 我 们 用 DSIC 这 个 术语 作为 定义 2. 3 里 的 第 一 个 条 件 ( 真 实 竞 价 是 占 优 
策略 )， 同 时 不 考虑 个 体 理性 条 件 (真实 竞价 的 竞拍 者 效用 不 会 为 负 )。 

Ca) 假定 我 们 通过 给 每 个 智能 体 的 支付 增加 一 个 关键 项 h;(b-;) 来 调整 
VCG 机 制 的 支付 规则 ( 式 (7.2))， 其 中 h;(*) 是 其 他 智能 体 竞 价 的 任 
意 函 数 。 关 键 项 可 正 可 负 ， 并且 可 以 导致 支付 从 机 制 流 向 智能 体 。 证 
W: 无 论 选择 什么 类 型 的 关键 项 ， 形 成 的 机 制 都 是 DSIC AY 

(CH) 假 定 智能 体 的 估 值 被 限定 在 集合 VCR? 中 。 如 果 对 于 所 有 可 能 的 
EM bC), s bW Ey， 相 应 的 VCG 支付 (包括 hi) 之 和 都 为 0， 
我 们 就 称 关键 项 {h;(，)”-1} 使 VCG 机 制 预算 平衡 。 

证 明 当 且 仅 当 最 大 社会 福利 可 以 表示 成 独立 于 竞价 的 函数 之 和 ， 即 当 
HRAFN bC), s bop CO EVRA 


(b 


w 


max 20 (al) = Sint) (7. 4) 
时 ， 才 存在 使 得 VCG 机 制 预算 平衡 的 关键 项 。 其 中 g; 是 不 依赖 于 。， 
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问题 7. 2 


问题 7. 3 


的 函数 。 

Cc) 直接 证 明 或 利用 (b) 证 明 : 不 存在 一 个 关键 项 能 够 使 单 物 品 二 价 拍卖 预 
算 平衡 。 归 纳 总 结 出 : 不 存在 DSIC 的 单 物 品 拍 卖 ， 能 够 最 大 化 社会 
福利 并 同时 满足 预算 平衡 。 

考虑 一 般 化 的 机 制 设计 环境 ， 结 果 集 合 为 ,智能 体 数目 为 2。 假 定 函 数 

f:Q—-R, REN 


Flw) = clw) + >) wv: (w) 
i=l 


Hp c 是 对 所 有 智能 体 公共 已 知 的 函数 ， 每 个 智能 体 i 都 有 一 个 非 负 上 且 公 

共 已 知 的 权重 ww;。 我 们 称 这 样 的 函数 为 仿 射 最 大 化 算 子 。 

证 明 : 对 于 每 个 仿 射 最 大 化 函数 f 和 结果 子 集 2 SO2， 都 存在 一 个 DSIC 

机 制 ， 其 在 Q' 上 能 最 大 化 fo 

考虑 一 个 组 合拍 卖 ( 例 7.2)， 物 品 集合 M 有 m 个 物品 ， 其 中 每 个 竞拍 者 i 

的 估 值 函数 w :2"—> Rt 都 满足 ， GD u=; Gi) 对 于 任意 SETEM， 都 

Av(S)<u(T); Gi FP AMAA S. TOM, BA uw SUD 

vi(S) 十 wv,(T)。 则 称 这 样 的 函数 是 次 可 加 的 。 

(a) 对 于 一 个 次 可 加 的 估 值 组 合 v， 如 果 存 在 一 个 最 大 化 社会 福利 的 分 配 
规则 ， 使 得 至 少 50% 的 社会 福利 是 由 那些 至 少 被 分 配 了 Vm 件 物品 的 
竞拍 者 贡献 的 ， 那 么 我 们 就 称 v 是 失衡 的 。 证明 ， MR» 是 失衡 的 ， 
那么 存在 将 所 有 物品 全 部 分 配给 同一 个 竞拍 者 的 分 配 规则 ， 其 产生 的 
e 1 
社会 福利 至 少 是 最 大 可 能 值 的 7 A 

(b) (H) 证 明 如 果 不 是 失衡 的 ， 那 么 存在 如 下 分 配 规则 : 每 个 莞 拍 者 至 


多 被 分 配 一 个 物品 ， 且 产生 的 社会 福利 至 少 是 最 优 解 的 fe 








1 

2 Vm 

(c) (H) 给 出 一 个 有 以 下 性 质 的 机 制 : (1) 对 于 某 些 捆绑 组 合 的 集合 S， 其 中 
1S| 关 于 是 多 项 式 级 的 ， 每 个 竞拍 者 都 提交 一 个 竞价 六 (CS)(SES ); 
(2) 对 于 任意 竞拍 者 i Mi 之 外 的 其 他 报价 ，b;(S) 二 vwv;(S) 对 于 任意 
SES 都 是 占 优 策略 ; (3) 假 设 竞拍 者 真实 竞价 ， 机 制 结 果 的 社会 福利 
至 少 是 最 优 解 的 - (4) 机 制 的 运行 时 间 是 竞拍 者 数量 n 和 物品 
数量 m 的 多 项 式 级 。 
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频谱 拍卖 





本 章 以 案例 分 析 的 形式 介绍 在 无 线 频谱 配置 中 运用 的 组 合拍 卖 ， 这 是 一 类 重要 且 
具有 挑战 性 的 多 参数 机 制 设 计 问 题 。 相 比 于 关键 字 搜 索 拍卖 ( 见 2.6 节 和 5.3 节 ) 中 遇 
到 的 成 千 上 万 个 小 量 级 的 拍卖 ， 频 谱 拍 卖 则 关心 具有 数 十 亿 潜 在 收益 的 单 次 拍卖 。 

8. 1 节 解 释 非 直接 机 制 的 实际 意义 ; 8. 2 节 讨 论 举 行 多 次 单 物品 拍卖 来 出 售 多 个 
物品 的 好 处 ; 8. 3 节 介 绍 无 线 频谱 拍卖 中 的 核心 拍卖 ， 同 时 升 价 拍 卖 ，8.4 节 考 量 由 
组 合 竞价 带 来 的 利 与 浆 ，8. 5 节 简 述 目前 最 前 沿 的 频谱 拍卖 一 一 2016 年 FCC 激励 拍 
卖 机 制 。 


8.1 FEB eH iil 


在 一 个 组 合拍 卖 中 ( 见 例 7.20. An PSEA. m Pin. EFA i 的 估 值 函数 
具体 表明 了 i 对 每 一 个 可 能 获得 的 拍品 子 集 S 的 价值 v;(S)。 原 则 上 ，VCG 机 制 就 是 
一 个 满足 DSIC 和 福利 最 大 化 的 组 合拍 卖 机 制 (定理 7. 3)。 如 果 竞 拍 者 的 估 值 函数 足 
够 简单 的 话 ( 见 练习 7.5)，VCG 机 制 就 是 一 个 可 用 的 机 制 ; 否则 的 话机 制 就 不 可 用 
( 见 7.3 节 )。 比 如 ， 当 每 个 竞拍 者 需要 向 VCG 机 制 或 者 其 他 直接 机 制 上 报 的 参数 的 
数量 是 m 的 指数 级 时 ， 机 制 是 不 可 用 的 。 

在 直接 组 合拍 卖 中 ， 竞 拍 者 需要 把 所 有 估 值 信息 上 报 给 拍卖 机 制 ， 这 有 时 是 不 合 
理 的 ， 因 此 催生 了 非 直 接 机 制 。 非 直接 机 制 根据 “有 必要 知晓 ”原则 来 获取 有 关 竞 拍 
者 偏好 的 信息 。 典 型 的 非 直接 机 制 是 英 式 升 价 拍卖 ， 见 练习 2.7。 此 拍卖 常见 于 电影 
中 而 被 我 们 熟知 : 一 位 拍卖 商 追 踪 当 前 的 价格 和 当前 的 赢家 ， 整 个 拍卖 直到 最 后 只 一 
下 一 个 竞拍 者 结束 ” 。 在 这 种 拍卖 中 ， 每 个 竞拍 者 都 有 一 个 占 优 策 略 : 只 要 当前 价 
格 低 于 他 的 估 值 ， 则 一 直 待 在 拍卖 里 (竞拍 者 可 能 赢得 拍卖 并 获得 一 个 正 的 收益 ); 





O ”目前 有 几 类 该 机 制 的 变种 。 在 电影 和 拍卖 行 (例如 佳 士 得 和 苏 富 比 拍卖 行 ) 里 ， 通 常 使 用 一 种 称 为 
“公开 叫价 ”的 拍卖 。 在 这 种 拍卖 里 ， 竞 拍 者 可 以 随意 地 退出 和 重新 加 入 ， 也 可 以 使 用 积极 的 “跳跃 
性 报价 ”来 抬 高 当前 价格 。 在 进行 数学 分 析 时 ,“ 日 本 式 ” 拍 卖 变 种 通常 更 简洁 一 些 : 拍卖 由 某 个 公 
开 的 价格 开始 ， 这 个 价格 被 公开 展示 给 所 有 人 并 以 一 个 平稳 的 速率 上 升 。 每 个 竞拍 者 可 以 在 某 个 价 
格 上 选择 要 么 “加 和 人 ”要么 “退出 ”， 并 且 竟 拍 者 只 要 退出 就 不 能 重新 加 入 。 赢 家 为 最 后 一 个 “加 
人 ”拍卖 的 竞拍 者 ， 其 支付 为 倒数 第 二 个 竞拍 者 退出 时 的 价格 。 
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只 要 当前 价格 高 于 他 的 估 值 ， 则 退出 拍卖 (在 这 之 后 赢 了 的 话 会 获得 一 个 负 的 收 
益 ) 。 如 果 所 有 竞拍 者 都 使 用 这 一 策略 ,那么 英 式 拍卖 的 最 终结 果 和 二 价 ( 密 封 ) 拍 
卖 的 结果 是 一 样 的。 其 实 二 价 拍卖 就 是 把 显示 原理 (定理 4. 3) 应 用 于 英 式 拍卖 后 得 
到 的 直接 机 制 。 

除了 一 些 最 简单 的 场景 外 ， 对 绝 大 部 分 的 组 合拍 卖 问 题 来 说 ， 使 用 抽取 适量 竞 
拍 者 估 值 信息 的 非 直 接 机 制 都 是 不 可 避免 的 >。 这 类 机 制 使 得 我 们 必须 要 放弃 DSIC 
和 福利 最 大 化 性 质 ; 目前 来 看 ,我 们 只 能 这 样 处 理 。 


8.2 ”分开 拍卖 多 个 物品 


一 个 自然 的 非 直接 组 合拍 卖 应 该 是 什么 样 的 ? 在 这 类 拍卖 中 ， 我 们 应 该 不 需要 向 
每 个 竞拍 者 索取 他 对 于 每 个 物品 子 集 的 估 值 。 最 简单 的 尝试 是 把 多 个 物品 分 开 来 卖 ， 
即 对 每 个 物品 采用 某 种 单 物品 拍卖 来 出 售 。 这 样 的 机 制 只 需要 每 个 竞拍 者 对 每 一 个 物 
品 报 一 个 竞价 就 可 以 ， 而 且 这 也 是 可 被 论证 的 所 需 的 最 小 信息 量 。 在 我 们 具体 阐述 这 
种 单 物 品 拍卖 形式 之 前 ， 我 们 需要 考虑 一 个 基本 的 问题 : 原则 上 ， 分 开拍 卖 多 个 物品 
是 否 能 达到 高 社会 福利 的 资源 配置 ? 
组 合拍 卖 中 的 物品 存在 两 种 截然 不 同 的 类 型 ,一 种 是 物品 间 互 为 替代 品 ， 男 一 种 
是 物品 间 互 为 互补 品 。 对 于 物品 之 间 是 替代 品 的 情况 ,不 论 是 在 理论 上 或 是 在 实践 应 
用 中 都 比 是 互补 品 的 情况 要 简单 。 粗 略 地 说 ， 如 果 物 品 对 竞拍 者 来 说 呈现 出 递减 的 效 
益 ， 也 就 是 说 每 获得 一 个 物品 都 使 得 剩余 的 同类 物品 贬值 那么 此 类 物品 就 属于 替代 
品 。 例 如 ， 有 两 个 物品 A 和 B， 他 们 是 替代 品 意味 着 v(AB) 三 vw(A) 十 v(B)。 在 频谱 
拍卖 中 ,同一 地 区 频 宽 相同 的 两 个 频谱 许可 证 通常 互 为 替代 品 。 理 论 研 究 表 明 ， 当 
物品 之 间 是 (或 者 近似 是 ) 替 代 品 时 ， 把 多 个 物品 分 开 单独 拍卖 能 取得 良好 的 效果 。 
首先 ， 当 物品 之 间 是 替代 品 ， 并 且 真 实 估 值 可 知 时 ， 福 利 最 大 化 是 一 个 计算 简单 的 
问题 。 此 外 ，VCG 机 制 中 不 良 的 激励 和 收益 问题 ( 见 7.3 节 和 练习 7.3、7.4) 也 不 
存在 了 ， 即 一 般 化 了 单 物 品 二 价 拍卖 中 的 可 靠 性 质 。 尽 管 如 此 ， 可 替代 的 多 物品 仍 
然 是 一 个 “简单 的 ”案例 。 当 分 开拍 卖 每 个 物品 时 ， 在 一 些 场景 下 ， 事 情 很 容易 就 
ZEM 
如 果 物 品 之 间 存 在 协同 效应 的 话 ， 即 获得 一 个 物品 使 得 剩余 其 他 的 物品 更 有 价 
值 ， 它 们 就 互 为 互补 品 ， 也 就 是 说 v(AB) 宇 v(A) 十 v(B)。 互 补品 在 无 线 频谱 拍卖 中 
天 然 存 在 ， 因 为 一 些 竞 拍 者 想 要 获得 一 些 ( 地 理 上 或 者 频率 域 上 ) 邻 近 的 频谱 。 当 物 





名” 非 直接 机 制 在 单 参数 场景 中 ， 比 如 单 物品 拍卖 中 ， 也 是 很 有 用 的 。 实 证 研究 表明 竞拍 者 更 偏好 于 在 
英 式 拍卖 而 不 是 在 密封 二 价 拍卖 中 采用 占 优 策 略 。 在 密封 二 价 拍卖 中 ， 一 些 竞拍 者 会 有 莫名 的 过 高 
出 价 行为 。 另 外 ， 升 价 拍卖 泄露 给 卖家 的 信息 更 少 。 在 密封 二 价 拍 卖 中 ， 卖 家 会 得 知 最 高 竞价 ; 而 
在 英 式 拍 卖 中 ， 卖 家 只 能 获悉 最 高 竞价 的 下 界 ， 也 即 最 终 成 交 价 格 。 
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品 之 间 为 互补 品 时 ， 即 便 我 们 忽略 激励 约束 (问题 4.3),， 福利 最 大 化 也 是 计算 困难 
的 。 在 这 类 例子 里 ， 我 们 不 能 指望 找到 类 似 分 开拍 卖 物 品 且 性 能 良好 的 简单 拍卖 
机 制 o 

通常 ， 在 频谱 拍卖 和 大 部 分 常见 的 组 合拍 卖 中 ， 待 拍 物品 往往 是 替代 品 和 互补 品 
的 混合 体 。 如 果 物 品 大 多 是 替代 品 ， 那 么 通过 合适 的 设计 ,分开 拍卖 单个 物品 会 有 良 
好 的 表现 ; 否则 ， 我 们 需要 设计 更 复杂 的 拍卖 形式 ， 来 获得 具有 高 社会 福利 的 分 配 
(CH 8.4 47). 


8.3 案例 分 析 : 同时 升 价 拍卖 


8.3.1 两 个 新 手 常 见 错误 


当 拍 卖 多 个 物品 时 ， 有 很 多 种 方法 都 可 以 用 来 组 织 分 离 式 单 物品 拍卖 。 本 节 讨 论 
两 种 在 具体 实现 中 看 起 来 可 行 的 设计 。 


新 手 常 见 错误 1 
逐次 进行 单 物品 拍卖 ， 每 次 拍卖 一 个 物品 。 


为 了 说 明 为 什么 逐次 举行 拍卖 是 一 个 糟糕 的 想法 ， 考 虑 一 个 非常 简单 的 & 物 
品 拍卖 4( 见 例 3. 2) 。 在 这 个 拍卖 中 ， 物 品 都 是 相同 的 ， 并 且 每 个 部 拍 者 只 需要 一 
个 。 在 此 场景 下 ， 有 一 个 简单 的 能 够 实现 DSIC 和 福利 最 大 化 的 拍卖 机 制 ( 练 
习 2. 3)。 假 设 我 们 举行 一 系列 的 单 物品 拍卖 ， 比 如 通过 举行 两 次 二 价 拍卖 来 出 
售 两 个 相同 的 物品 。 想 象 着 你 是 一 个 拥有 非常 高 估 值 的 竞拍 者 ， 即 预期 在 参与 的 
任何 一 场 拍卖 中 都 能 取胜 。 那 么 你 应 该 怎么 做 ? 首先 ， 假 设 其 他 竞拍 者 都 持续 参 
与 拍卖 ， 并 以 他 们 的 真实 估 值 作为 竞价 (直到 赢得 一 个 物品 后 才 退 出 拍卖 )。 如 果 
你 参与 第 一 场 拍卖 ， 那 么 你 将 赢得 拍卖 并 支付 次 高 估 值 。 如 果 你 跳 过 第 一 场 拍卖 ， 
拥有 次 高 估 值 的 竞拍 者 将 赢得 拍卖 并 退出 ， 此 时 你 会 赢得 第 二 场 拍卖 ， 但 只 需要 支 
付 在 第 一 场 拍 卖 中 的 第 三 高 估 值 。 因 此 ,直截了当 地 报告 自己 真实 的 估 值 在 连续 多 
场 二 价 拍卖 中 不 是 一 个 占 优 策略 。 聪 明 的 竞价 需要 推理 出 后 续 拍卖 中 可 能 的 成 交 
价 ， 此 种 竞价 行为 会 导致 拍卖 结果 的 不 可 预测 性 ， 并 有 可 能 获得 低 社会 福利 的 资源 
分 配 以 及 低 的 收益 。 

在 2000 年 3 月 ， 瑞 士 利 用 一 系列 二 价 拍卖 分 配 了 三 个 频谱 块 。 前 两 场 拍 卖 出 售 
了 两 个 相同 的 28MHz 的 频谱 块 ， 最 终 分 别 以 1.21 亿 和 1. 34 亿 和 瑞士 法 郎 成 交 。 这 种 
价格 上 的 差别 对 于 拍卖 两 个 相同 的 物品 来 说 , 已 经 算是 比较 大 的 了 。 意 外 的 是 在 第 三 
Xt 56MHz 频谱 块 的 拍卖 中 ， 成 交 价 仅 为 5500 万 瑞士 法 郎 ! 其 中 的 一 些 竞 标价 肯 
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定 远 远 偏离 了 最 优 出 价 ， 本 场 拍卖 获 得 的 低 效率 和 低 收益 很 难 让 人 满意 。” 
上 述 的 讨论 和 历史 教训 告诉 我 们 ， 在 拍卖 多 物品 时 ， 应 该 同时 进行 拍卖 而 不 是 序 
贯 地 进行 拍卖 。 如 此 的 话 应 该 选择 什么 样 的 单 物 品 拍卖 方式 呢 ? 





新 手 常 见 错误 2 
使 用 密封 竟 价 式 单 物品 拍卖 。 





1990 年 ， 新 西 兰 政府 使 用 (密封 ) 二 价 拍卖 出 售 了 本 质 上 相同 的 应 用 于 电视 广播 
的 一 系列 许可 证 。 在 这 种 拍卖 中 竞拍 者 依旧 很 难 搞 清楚 该 如 何 竞价 。 想 象 总 共有 10 
个 许可 证 ， 而 你 想 要 其 中 一 个 。 你 应 该 怎样 竞价 ? 一 个 合乎 情理 的 策略 是 ， 随 机 选择 
其 中 一 个 许可 证 ， 然 后 只 为 它 竞 价 。 另 一 个 策略 是 ， 在 多 个 许可 证 上 进行 不 太 积极 的 
竞价 ， 以 期 待 能 够 以 低 价 获得 一 个 许可 证 ; 并 且 还 要 避免 获得 不 想 要 的 许可 证 。 对 于 
竞拍 者 而 言 ， 困 难 在 于 如 何 权 衔 获 得 过 多 与 过 少许 可 证 之 间 的 风险 。 

在 同时 密封 竞价 拍卖 中 明智 地 进行 竞价 是 富有 挑战 性 的 ， 这 也 最 终 导致 此 种 拍卖 
很 容易 就 以 低 社会 福利 和 低 收益 收尾 。 例 如 ， 假 设 有 三 个 竞拍 者 和 两 个 相同 的 物品 ， 
每 个 竞拍 者 只 要 其 中 一 个 。 当 使 用 同时 密封 二 价 拍卖 时 ， 如 果 每 个 竞拍 者 都 只 锁定 一 
个 竞价 物品 ， 那 么 其 中 一 个 物品 很 可 能 只 有 一 个 竞拍 者 竞价 ， 此 时 它 将 会 被 免费 地 分 
配 出 去 (或 者 以 保留 价 成 交 ) 。 

1990 年 新 西 兰 拍卖 的 收益 只 有 3600 万 美元 ， 是 计划 收益 的 2.5 亿美 元 中 很 小 的 
一 部 分 。 在 某 个 许可 证 上 ， 最 高 竞价 是 100 000 美元 ， 次 高 价 (成 交 价 ) 是 6 美元! 在 
另外 一 个 许可 证 上 ， 最 高 竞价 为 700 万 美元 ， 次 高 价 为 5000 美元 。 更 严重 的 是 ， 所 
有 感 家 的 竞标 价 都 暴露 在 公众 的 视野 之 下 ! 


8.3.2 同时 升 价 拍卖 的 优点 


在 过 去 20 多 年 里 ， 同 时 升 价 拍 卖 (Simultaneous Ascending Auction，SAA) 构 成 
了 大 部 分 频谱 拍卖 的 基础 。 从 概念 上 来 看 ， 同 时 升 价 拍卖 就 像 是 多 个 单 物品 英 式 拍卖 
在 同一 个 房间 里 并 行 举行 ， 每 个 拍卖 商 拍卖 一 个 物品 。 更 确切 地 说 ， 在 每 一 轮 里 ， 并 
且 在 满足 活跃 规则 (activity rule) 的 前 提 下 ， 每 一 个 竞拍 者 都 能 对 他 想 要 的 物品 子 集 
进行 出 价 。 活 路 规则 强制 所 有 竞拍 者 从 最 开始 就 参与 到 拍卖 中 来 ， 以 帮助 揭示 待 拍 物 
品 的 合适 价格 。 这 样 的 规则 可 以 防止 竞拍 者 进行 “狙击 ",“ 狙 击 ” 是 指 竞拍 者 在 拍卖 
结束 的 最 后 一 秒 突然 杀 入 并 放置 一 个 可 以 赢 的 竞价 。 活 跃 规则 的 细节 可 能 非常 复杂 ， 
它 的 要 点 是 ， 要 保证 一 个 参与 者 所 竞拍 的 物品 的 数目 随 着 价格 的 不 断 升 高 而 减少 。 尽 





加 ”除了 拍卖 方式 有 问题 外 ， 在 拍卖 之 前 也 存在 潜在 竞拍 者 之 间 进 行 策略 性 合并 的 问题 ， 这 导致 了 竞争 
局 面 比 期 望 上 要 低 。 





管 会 众 惠 发 信号 行为 和 报复 性 竞价 ， 但 通常 在 这 些 规则 下 ， 高 的 竞拍 价 和 竞拍 者 对 所 
有 人 而 言 都 是 可 见 的 (8. 3.4 节 )。 拍 卖 将 会 在 没有 新 报价 的 轮 次 结束 。 

同时 升 价 拍卖 比 序 贯 或 者 密封 竞价 拍卖 效果 好 的 主要 原因 在 于 价值 发 现 (price 
discovery)。 随 着 竞拍 者 在 拍卖 中 获取 了 更 好 的 有 关 许 可 证 成 交 价 的 信息 ， 他 在 中 途 
可 以 对 自己 的 策略 进行 一 些 纠正 : 放弃 掉 那 些 比 期 望 中 竞争 激烈 的 许可 证 ; 抢购 一 些 
意 想 不 到 的 廉价 品 ; 重新 制定 目标 许可 证 集合 。 这 种 方式 很 有 代表 性 ， 它 解决 了 同时 
密封 竞价 拍卖 中 的 不 协调 问题 。 比 如 ， 假 设 有 两 个 相同 的 物品 和 三 个 竞拍 者 。 每 一 轮 
中 ， 肯 定 存在 某 个 竞拍 者 同时 在 两 场 拍卖 中 落 败 。 当 他 重新 竞价 加 入 新 一 轮 拍卖 时 ， 
理所当然 地 他 会 在 当前 价格 更 低 的 那个 物品 上 进行 加 价 ， 这 就 大 体 上 维持 了 待 拍 的 两 
物品 处 于 相同 的 价格 。 

采用 同时 升 价 拍卖 的 另外 一 个 好 处 是 ， 竞 拍 者 只 需要 根据 “有 必要 知晓 ”原则 来 
确定 对 物品 的 估 值 。 我 们 一 直 假 设 竞 拍 者 在 拍卖 开始 时 就 知道 自己 对 物品 的 估 值 ， 但 
是 实际 上 ， 为 了 确定 一 组 物品 的 估 值 ， 可 能 会 产生 一 些 费 用 ， 比 如 调研 和 专业 咨询 
费 。 与 直接 机 制 截然 不 同 的 是 ， 在 同时 升 价 拍卖 中 ， 竞 拍 者 可 以 只 使 用 一 部 分 组 合 物 
品 的 粗略 估 值 和 自己 所 关心 物品 的 精确 估 值 来 进行 竞价 。 

人 们 普遍 认为 ， 在 大 量 的 频谱 拍卖 中 ， 同 时 升 价 拍卖 都 获得 了 较 高 的 社会 福利 
和 收益 。 但 是 这 种 普 志 的 看 法 很 难 被 严格 证 明 ， 因 为 在 拍卖 结束 后 竞拍 者 的 估 值 信 
息 依 旧 未 知 ， 竞 价 不 完全 并 且 报 价 可 能 是 非 真实 的 。 虽 然 如 此 ， 也 存在 一 些 合理 的 
指标 来 评估 一 个 拍卖 机 制 的 性 能 。 首 先 ， 拍 卖 结束 后 应 该 只 有 少量 或 是 没有 转卖 行 
为 ， 并 且 转 卖 价格 应 该 是 和 拍卖 的 成 交 价 相近 。 这 也 就 意味 着 ， 投 机 者 在 拍卖 中 的 
作用 甚 徽 。 其 次 ， 相 似 的 物品 的 成 交 价 应 该 类 似 (参见 瑞士 和 新 西 兰 的 拍卖 )。 第 
， 拍 卖 获 得 的 收益 应 该 达到 或 超过 预期 。 第 四 ， 拍 卖 中 应 该 显示 出 价值 发 现 的 迹 
象 。 例 如 ， 在 拍卖 过 程 中 的 价格 和 临时 赢家 应 该 和 最 终 成 交 价 及 最 终 赢 家 高 度 相 
关 。 最 后 ， 竞 拍 者 获得 的 物品 集合 应 该 是 合理 的 ， 比 如 获得 地 理 上 或 是 频谱 域 上 相 
邻 的 许可 证 组 合 。 


{1 


8.3.3 需求 缩减 和 披露 问题 


同时 升 价 拍卖 有 两 大 问题 。 第 一 个 问题 是 需求 缩减 (demand reduction)， 即 便 在 
拍品 是 蔡 代 品 的 情况 下 这 个 问题 也 存在 。 需 求 缩 减 是 指 竞 拍 者 发 布 一 个 比 真 实 需求 少 
的 需求 量 ， 以 求 降低 竞争 ， 并 以 较 低 的 价格 获得 一 些 物品 。 

为 了 说 明 这 个 问题 ， 假 设 有 两 个 相同 的 物品 和 两 个 竞拍 者 。 竞 拍 者 1 对 获得 一 个 
物品 的 估 值 为 10， 对 获得 两 个 物品 的 估 值 为 20。 竞 拍 者 2 对 获得 一 个 物品 的 估 值 为 
8， 但 他 不 想 同 时 获得 两 个 物品 (也 就 是 说 他 对 获得 两 个 物品 的 估 值 也 是 8)。 把 两 个 
物品 都 给 竞拍 者 1 将 会 最 大 化 社会 福利 ， 总 福利 为 20。 本 例 中 采用 VCG 机 制 的 话 ， 
收益 为 8。 现在 我 们 考虑 在 同时 升 价 拍 卖 中 会 发 生 什 么 。 竞 拍 者 2 会 很 乐意 以 低 于 8 
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的 价格 获得 其 中 任意 一 个 物品 。 因 此 ， 当 两 个 物品 的 竞价 都 大 于 等 于 8 WHR. SETA 
者 2 会 退出 拍卖 。 如 果 竞 拍 者 1 固执 地 坚持 赢得 两 个 物品 ， 那 么 最 终 他 的 收益 会 是 
20 一 16 二 4。 但 从 男 一 个 方面 考虑 ， 如 果 第 一 个 竞拍 者 只 选 定 一 个 物品 作为 竞拍 目标 ， 
那么 每 一 个 竞拍 者 都 会 获得 一 个 物品 ， 并 且 以 近乎 0 的 价格 成 交 。 此 时 竞拍 者 1 的 收 
益 接近 10。 相 比 于 VCG 机 制 的 结果 ， 在 此 例 中 ， 需 求 缩减 行为 导致 了 很 低 的 社会 福 
利和 收益 。 有 充分 的 证 据 表 明 ， 在 很 多 频谱 拍卖 中 都 存在 需求 缩减 行为 。 

同时 升 价 拍 卖 的 第 二 个 问题 发 生 在 物品 是 互补 品 的 情况 下 (例如 频谱 拍卖 中 )。 这 
个 问题 称 为 披露 问题 (exposure problem)。 考 虑 两 个 竞拍 者 和 两 个 不 同 的 物品 。 竞 拍 
者 1 只 想 要 两 个 物品 ( 即 对 此 竞拍 者 而 言 他 们 是 互补 品 )， 并 且 他 对 获得 两 个 物品 的 估 
值 为 100( 对 任何 其 他 结果 的 估 值 为 0)。 第 二 个 竞拍 者 愿意 为 其 中 一 个 且 仅 仅 一 个 支 
付 75。VCG 机 制 会 将 两 个 物品 都 分 配给 竞拍 者 1， 产 生 的 福利 为 100， 效 用 为 75。 
在 同时 升 价 拍卖 中 ， 竞 拍 者 2 在 其 中 任何 一 个 物品 的 价格 达到 75 之 前 时 都 不 会 退出 
拍卖 。 竞 拍 者 1 处 于 必 败 的 境地 : 为 了 获得 两 个 物品 ， 他 需要 支付 150， 这 超出 了 他 
对 物品 的 估 值 。 而 赢得 其 中 一 个 物品 会 使 得 情况 变 得 更 糟 。 另 一 方面 ， 如 果 竞 拍 者 2 
对 获得 任意 一 个 物品 的 估 值 为 40， 那 么 竞拍 者 1 就 应 该 全 力 竞价 ， 同 时 他 也 能 逃 出 
竞拍 者 2 带 来 的 困境 。 问 题 在 于 竞拍 者 1 并 不 清楚 真实 场景 到 底 是 哪 一 个 。 在 同时 升 
价 拍卖 中 ， 披 露 问题 使 得 需要 互补 品 的 竞拍 者 在 竞价 上 变 得 很 困难 。 此 问题 能 通过 如 
下 两 个 方面 导致 经 济 上 无 效率 的 资源 配置 。 首先， 过 于 激进 的 竞拍 者 有 可 能 获得 不 想 
要 的 物品 。 其 次 ， 过 于 中 路 的 竞拍 者 可 能 错过 对 他 来 说 估 值 最 高 的 物品 组 合 。 


8.3.4 发 送 竞 价 信号 


像 同时 升 价 拍卖 这 样 的 迭代 式 拍卖 为 策略 性 竞价 提供 了 机 会 ， 而 这 样 的 行为 在 直 
接 显示 机 制 中 并 不 存在 。 在 早期 以 及 一 些 相对 来 说 竞争 不 太 激 烈 的 频谱 拍卖 中 ， 竞 拍 
者 有 时 会 使 用 竞价 的 后 几 位 来 有 效 地 给 其 他 竞拍 者 传递 信息 。 例 如 ，USWest 和 
McLeod 曾经 在 位 于 罗切斯特 市 和 明尼苏达 州 的 第 378 号 许可 证 上 进行 激烈 的 竞争 ， 
两 队 互 不 相让 。 显 然 ，USWest 厌倦 了 价格 战 随即 采用 了 报复 性 竞价 策略 : 在 
McLeod 处 于 领先 地 位 的 其 他 地 理 位 置 上 的 许可 证 上 进行 竞价 ， 而 USWest 在 之 前 几 
轮 里 对 这 些许 可 证 并 不 感 兴趣 。McLeod 最 终 还 是 赢 回 了 所 有 他 想 要 的 许可 证 ， 但 由 
于 USWest 的 报复 性 竞价 Mcleod 不 得 不 支付 更 高 的 价格 。 为 了 使 传递 的 信息 表达 得 
一 清二 楚 ， 所 有 USWest 的 报复 性 竞价 都 是 1000 的 倍数 再 加 一 个 378( 想 必 是 在 警告 
McLeod 赶紧 撤 出 罗切斯特 或 其 他 市 场 )。 然 而 像 这 种 类 型 的 信号 可 以 通过 强制 所 有 
竞价 必须 为 某 个 合适 数字 的 整数 倍 来 消除 ,但 通过 设计 规则 来 消除 所 有 的 策略 性 行为 
似乎 是 不 可 能 的 。 





8.4 组合 竞价 


披露 问题 促使 我 们 在 基本 的 同时 升 价 拍卖 中 引入 组 合 竞价 ， 也 就 是 说 竞拍 者 除了 
可 以 在 单独 的 物品 上 进行 竞价 外 ， 还 可 以 在 任意 物品 组 合 上 进行 竞价 。 组 合 竞价 允许 
竞拍 者 在 一 组 物品 上 进行 积极 的 竞价 而 不 用 担心 只 获得 这 组 物品 的 某 个 子 集 。 同 时 也 
存在 一 些 场景 ， 在 采用 组 合 竞 价 时 竞拍 者 缩减 需求 的 动机 得 以 被 消除 。 

在 频谱 拍卖 中 (如 果真 的 要 使 用 组 合 竞 价 的 话 ) 如 何 具 体 实施 组 合 竞 价 得 到 了 广泛 
的 讨论 。 保 守 的 观点 (直到 最 近 还 指导 着 实践 ) 认 为 组 合 竞价 增加 了 实用 型 拍卖 的 复杂 
度 并 且 可 能 会 导致 不 可 预测 的 结果 。 仅 在 10 年 前 左右 ,一 些 组 合 竞价 形式 才 被 正式 
纳入 频谱 拍卖 设计 中 ， 并 且 全 都 在 美国 境外 。 

第 一 种 设计 方法 是 在 同时 升 价 拍卖 结束 后 附加 一 个 额外 的 回合 ， 在 这 个 回合 里 竟 
拍 者 在 满足 活跃 规则 下 可 以 提交 任何 他 想 要 的 物品 子 集 的 竞价 。 这 些 组 合 竞价 不 仅 相 
互 之 间 在 竞争 ， 而 且 也 与 在 同时 升 价 拍卖 阶段 中 单个 物品 的 中 标价 进行 竞争 。 最 终 的 
分 配 通过 最 大 化 社会 福利 来 确定 (假定 所 有 竞价 都 是 真实 的 ) 。 这 个 方法 的 最 大 问题 在 
于 计算 最 终 的 价格 很 困难 。 由 于 低 收益 以 及 激励 问题 ，VCG 支付 并 没有 被 使 用 ( 见 
7. 3 节 和 练习 7. 2 一 7.4)。 取 而 代 之 的 是 一 个 更 加 积极 的 支付 规则 ， 虽 然 不 是 DSIC 
的 ,但 拥有 一 些 其 他 良好 的 激励 性 质 。 

第 二 种 方法 是 预先 定义 好 一 些 可 被 允许 进行 组 合 竞价 的 物品 集合 ， 而 不 是 让 竞拍 
者 自由 地 进行 组 合 竞价 。 理 想 情 况 下 ， 这 些 预定 义 的 组 合 竞价 集合 应 该 尽量 和 竞拍 者 
们 想 要 的 集合 相符 合 ， 而 且 最 好 被 充分 的 结构 化 以 便于 导出 既 合 理 又 简单 的 分 配 规则 
和 支付 规则 。 作 为 一 个 最 佳 方案 ， 针 对 这 种 方法 的 分 层级 包 技术 被 提出 来 了 。 例 如 ， 
一 场 拍卖 里 可 以 允许 在 单独 许可 证 上 的 竞价 ， 也 允许 在 区 域 性 许可 证 集合 或 州 级 许可 
证 集合 上 的 竞价 。 预 定义 组 合 竞 价 方法 最 大 的 问题 在 于 ， 当 预定 义 的 组 合 竞价 集合 与 
竞拍 者 的 目标 集合 相差 甚 远 时 ， 这 种 方法 弊 大 于 利 。 比 如 ， 一 个 竞拍 者 想 要 的 物品 集 
AA, B, C, D}, 但 是 可 用 的 竞价 包 只 有 {A，B, E, F}/M{C, D, H, I}. W 
时 他 的 竞价 策略 该 是 什么 ? 


8.5 案例 分 析 : 2016 年 FCC 激励 拍卖 


无 线 频谱 并 非 伸手 可 得 。 在 美国 把 频谱 分 给 一 个 人 一 般 意味 着 需要 从 另 一 个 人 手 
中 收购 。 美 国联 邦 通信 委员 会 (The U. S. Federal Communications Commission, FCC) 
恰恰 就 是 做 这 些 事情 的 ， 他 们 首先 使 用 逆向 拍卖 (参见 练习 2.5) 从 电视 广播 业 买 下 
一 些 频 谱 ， 然 后 通过 一 个 前 向 拍卖 把 这 些 频谱 转卖 给 那些 能 充分 利用 这 些 资源 的 
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前 向 拍卖 的 形式 和 前 些 章节 的 设计 ( 见 8.3 节 和 8.4 节 ) 类 似 ， 而 逆向 拍卖 却 是 全 
新 的 。 

为 了 使 得 可 用 的 新 频谱 处 于 连续 的 范围 ， 逆 向 采购 拍卖 结束 后 FCC 会 把 剩余 的 
广播 信号 进行 重新 打包 。 例 如 ，FCC 会 从 电视 广播 公司 买 下 使 用 中 的 38 一 51 UHF 
频道 ， 然 后 把 剩余 其 他 电视 广播 公司 重新 分 配 到 低频 道上 。 如 此 的 话 ， 在 38 一 51 频 
道 区 间 就 会 产生 一 个 84MHz 的 频谱 块 ， 此 块 在 前 向 拍卖 中 被 重新 分 配 。 

逆向 拍卖 的 分 配 规则 设计 得 很 出 色 ， 整 体 上 可 以 看 成 是 一 种 贪心 分 配 规则 ， 其 与 
4.2 节 描 述 的 背包 拍卖 的 分 配 规则 相同 。 为 了 描述 这 个 规则 ， 我 们 采用 如 下 模型 。 每 
个 竞拍 者 元 一 个 电视 广播 公司 ) 对 广播 许可 证 有 一 个 私有 的 估 值 v;。 如 果 竞 拍 者 i 失 
败 了 (也 就 是 说 他 的 许可 证 权 没 有 被 购买 ) ， 那 么 他 的 收益 是 0。 如果 他 以 价格 poi 
的 话 (以 价格 p 被 收购 了 )， 那 么 他 的 收益 为 p 一 v;。 因 此 vi 可 以 认为 是 从 竞拍 者 i F 
中 购买 许可 证 的 最 少 出 价 。 用 N 表示 所 有 竞拍 者 集合 ， 对 于 一 个 赢家 集合 WON, 
如 果 剩 余 的 竞拍 者 NAW 能 够 被 重新 配置 到 目标 频道 区 间 ( 比 如 所 有 小 于 38 的 频道 )， 
那么 我 们 就 称 一 个 赢家 集合 克 是 可 行 的 。 例 如 ， 如 果 丈 =N， 那 么 所 有 竞拍 者 的 频 

谱 都 被 购买 了 ， 频 谱 全 都 空 闻 了 ， 所 以 W VEET., W=., RA H gk E 
收 利 用 ， 是 一 个 不 可 行 的 结果 。 在 地 理 位 置 上 有 重 释 的 两 个 电视 基站 不 能 被 分 配 到 相 
同 或 是 相 邻 的 频道 上 ， 并 且 确 定 一 个 赢家 集合 是 否 可 行 是 一 个 中 等 大 小 的 NP 困难 问 
题 (与 图 着 色 问 题 密切 相关 ， 见 图 8. 1) 。 当 前 建立 在 可 满足 性 (SAT) 求 解 器 上 最 先进 
的 算法 可 以 在 几 秒 之 内 完成 这 类 问题 的 可 行 性 检验 ，。 





图 8.1 有 重合 区 域 的 不 同 电 视 基站 必须 被 分 配 到 不 同 的 频道 上 (灰色 所 示 )。 检 查 一 个 给 定 的 基 
站 子 集 是 否 能 够 无 冲突 地 分 配 到 给 定数 量 的 频道 上 是 一 个 NP 困难 问题 





这 次 拍卖 自 2016 年 3 月 29 号 开始 实施 ， 并 且 本 文 撰 写 过 程 中 拍卖 正在 进行 。 

这 个 单 参数 模型 假设 每 一 个 电视 站 都 被 一 个 不 同 的 策略 性 智能 体 所 拥有 。 虽 然 这 个 假设 在 现实 场景 
下 不 尽 为 真 ， 但 会 使 得 对 模型 的 分 析 变 得 很 简单 。 

有 趣 的 问题 是 如 何 设置 这 个 目标 区 间 。 目 标 区 间 越 大 ， 首 向 拍卖 中 购买 每 单元 频谱 的 花费 越 高 ， 导 
致 前 向 拍卖 中 出 售 每 单元 频谱 的 收益 越 小 。 目 前 使 用 的 方案 是 在 满足 一 个 净 收 益 下 界 的 情况 下 ， 把 
目标 区 间 设 置 得 尽 可 能 大 。 
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我 们 接 下 来 给 出 在 逆向 拍卖 中 使 用 的 延迟 分 配 规则 (deferred allocation rule), © 





延迟 分 配 规则 
初始 化 W=N /初始 化 的 可 行 解 
while 存在 竞拍 者 iEW 18 ft W \ {i} T fT Ht do 
KW 中 移 除 一 个 这 样 的 i  // 不 购买 i 
返回 赢家 集合 WW 











此 分 配 规则 从 一 个 平凡 可 行 集 (所 有 竞拍 者 集合 ) 开 始 ， 和 迭代 地 移 除 竞拍 者 直到 
获得 一 个 最 小 的 可 行 集 。 因 为 算法 是 从 全 集中 移 除 竞拍 者 ， 所 以 这 是 一 个 “反问 贪 
心算 法 ”。 相 反 ， 典 型 的 (前 向 ) 贪 心算 法 是 从 空 集 开始 迭代 地 添加 竞拍 者 (参见 
A. 2. Bi is 

在 每 一 轮 中 ,我 们 应 该 如 何 选择 被 移 除 的 竞拍 者 呢 ? 一 个 自然 的 想法 是 移 除 那 个 
要 价 最 高 的 竞拍 者 ( 即 最 不 想 卖 的 那个 人 )， 或 者 移 除 要 价 与 市 场 规模 比值 最 大 的 那个 
竞拍 者 。 de 个 赋 分 函数 (scoring function) 使 得 此 类 启发 式 过 程 
变 得 一 般 化 ， 这 个 函数 为 每 一 SRM sete PR — TAR 在 满足 可 行 性 条 
fF FE, rateira igo e e 

一 个 简单 的 赋 分 函数 是 恒 等 函 数 。 对 应 的 分 配 算法 为 : 对 每 个 竞拍 者 依次 进行 判 
断 ( 按 要 价 从 高 到 低 )， 只 要 移 除 这 个 竞拍 者 后 可 行 性 条 件 还 满足 ， 那 么 就 直接 移 除 
他 。 例 如 ， 在 雇佣 承包 商 问题 中 ， 分 配 规 则 意味 着 只 需 选 择 要 价 最 低 的 那 位 即 可 。 

如 果 赋 分 函数 与 竞拍 者 的 竞价 成 正比 并 且 独 立 于 其 他 剩余 的 竞拍 者 ， 那 么 对 
应 的 延迟 分 配 算法 是 单调 的 。 在 本 节 逆 向 拍卖 场景 下 ， 单 调 意味 着 要 价 越 低 ， 竞 
拍 者 越 会 中 标 ( 练 习 8. 3)。 由 迈 尔 森 引 理 ( 定 理 3.7) 可 知 ， 如 果 支 付 给 每 位 赢家 

一 个 关键 价格 ， 即 此 赢家 能 够 被 采购 的 最 高 要 价 ， 那 么 就 会 导出 一 个 DSIC 的 拍 
卖 S。 使 用 恒 等 赋 分 函数 的 雇佣 承包 商 问 题 中 的 拍卖 形式 和 练习 2. 5 中 的 拍卖 是 完全 
相同 的 。 

引 人 注 意 的 是 ， 延 迟 分 配 规 则 产生 的 机 制 拥 有 很 多 良好 的 动机 属性 ， 这 些 动 机 属 
性 比 DSIC 更 重要 ， 并 且 这 些 属性 在 前 向 贪心 算法 中 并 不 存在 (问题 8. 1) 。 


名 ”这 个 术语 受 启发 于 计算 稳定 匹配 的 “延迟 接受 ”算法 ( 见 10.2 节 )。 

© 2016 年 FCC 激励 拍卖 中 所 使 用 的 赋 分 函数 由 几 个 要 素 组 成 ,包括 在 仿真 数据 中 使 用 不 同 规则 得 到 的 
社会 福利 ， 以 及 作用 于 竞拍 者 之 间 的 政策 上 可 行 的 价格 歧视 等 限制 条 件 。 

O 为 了 便于 竞拍 者 参与 拍卖 ，FCC 拍卖 实际 上 不 是 以 直接 显示 形式 ,而 是 以 迭代 的 形式 来 实施 的 ， 并 
且 使 用 了 递减 的 、 指 定 竞 拍 者 的 价格 。 在 每 一 轮 拍卖 中 ， 每 个 竞拍 者 只 能 决定 在 当前 出 价 下 是 继续 
待 在 拍卖 里 ， 还 是 拿 着 许可 证 退出 。 拍 卖 初期 FCC 给 每 个 人 的 出 价 都 足够 高 ， 每 个 人 都 很 高 兴 参 加 
拍卖 。 比 如 ， 对 纽约 WCBS-TV 的 首次 开价 为 9 亿美 元 。 


总 结 


说 明 
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直接 显示 机 制 除了 在 一 些 最 简单 的 问题 中 ， 在 其 他 所 有 的 组 合拍 卖 问题 中 都 
是 不 可 能 被 实施 的 。 

非 直接 机 制 通过 “有 必要 知晓 ”原则 来 获取 竞拍 者 的 偏好 信息 。 

把 多 个 物品 分 开 来 卖 在 物品 是 替代 品 的 情况 下 效果 良好 ; 但 当 物 品 是 互补 品 
时 ， 分 开 卖 会 产生 较 低 的 社会 福利 。 

在 实践 中 ， 分开 卖 多 个 物品 的 首选 方法 是 同时 升 价 拍卖 。 

同时 升 价 拍卖 面临 着 需求 缩减 问题 ， 即 竞拍 者 通过 减少 所 需 的 物品 数目 来 压 
低 最 终 的 成 交 价 。 

当 物品 为 互补 品 时 ， 同 时 升 价 拍卖 也 会 面临 披露 问题 ， 即 只 需要 某 个 物品 集 
合 的 竞拍 者 面临 着 最 终 只 会 获得 一 个 无 用 的 物品 子 集 的 风险 。 

组 合 竞价 可 以 缓解 披露 问题 ， 但 是 实现 起 来 很 困难 。 

2016 年 FCC 激励 拍卖 是 第 一 个 引入 疼 向 拍卖 的 机 制 ， 政 府 通过 从 电视 广播 公 
司 购买 许可 证 来 重新 回收 利用 频谱 。 

延迟 分 配 规则 是 一 大 类 拥有 良好 动机 属性 的 逆向 拍卖 分 配 规则 。 


Cramton(2006) 和 Milgrom(2004) 从 历史 和 实践 两 方面 详细 介绍 了 无 线 频谱 拍 
卖 。 了 解 更 多 有 关 组 合拍 卖 的 理论 和 有 具体 实现 参见 Cramton 等 (2006) 和 Klemperer 
(2004). Rassenti 等 (1982) 介 绍 了 组 合拍 卖 的 早期 应 用 ， 即 机 场 起 落 时 间 槽 的 分 配 。 

Harstad(2000) 论 证 了 竞拍 者 更 愿意 在 英 式 拍卖 而 不 是 密封 二 价 拍卖 中 使 用 占 优 
策略 。Cramton 和 Schwartz(2000) 详 述 了 在 早期 频谱 拍卖 中 的 串 谋 和 发 信号 行为 。 
Ausubel 和 Milgrom (2002) 提 议 使 用 一 个 代理 回合 来 实现 组 合 竞 价 ， 而 Goeree 和 
Holt(2010) 则 主张 使 用 预定 义 的 分 层级 包 来 实现 组 合 竞 价 。FCC 激励 拍卖 设计 的 详 


情 见 于 


网 站 公告 里 (Federal Communications Commission, 2015), Milgrom 和 Segal 


(2015a，b) 讨 论 了 设计 逆向 拍卖 的 高 层 观 点 ， 并 定义 了 延迟 分 配 规则 。 练 习 8. 3 和 问 
题 8.1 和 8.2 出 自 Milgrom 和 Segal(2015a)。 用 于 实现 可 行 性 检验 的 算法 参见 
Fréchette 等 (2016) 。 问 题 8. 3 出 自 Shapley 和 Shubik(1971)。 


练习 


练习 8.1 〈H) 同 时 升 价 拍卖 (8. 3 节 ) 的 理想 结果 是 使 得 物品 集合 M=(1, 2, +, 


78 


练习 8.2 


练习 8.3 


问题 


问题 8. 1 


HEF 





m) 达 到 瓦尔 拉 斯 均衡 (Walrasian equilibrium)。 瓦 尔 拉 斯 均衡 是 指 分 给 n 
个 竞拍 者 的 物品 集合 S,，……，SEM 以 及 每 个 物品 的 成 交 价 pis o Pn 
满足 以 下 条 件 。 








瓦尔 拉 斯 均衡 
1. 给 定价 格 向 量 p， 每 个 竞拍 者 i 获得 他 偏好 的 物品 集合 : 
S: € argmax(v,(S) — >7p,) 
2. 供需 平衡 : 每 一 个 物品 7 最 多 只 出 现在 一 个 集合 S, P, 并且 只 有 当 
价格 方 一 0 时 才 会 卖 不 出 去 。 











证 明 如 果 一 个 分 配 (S, ，…，S,) 和 价格 向 量 p 构成 瓦尔 拉 斯 均衡 ,那么 此 
分 配 最 大 化 社会 福利 。( 这 也 是 “福利 第 一 定理 ”的 一 种 表现 形式 。) 

《CH) 证 明 即 使 在 只 有 两 个 竞拍 者 和 两 个 物品 的 组 合拍 卖 里 ， 瓦 尔 拉 斯 均衡 
也 不 一 定 存 在 。 

考虑 在 延迟 分 配 规则 中 使 用 赋 分 函数 移 除 竞拍 者 (8.5 节 )。 赋 分 函数 为 拍 
卖 中 剩余 的 竞拍 者 分 别 赋予 一 个 分 数 ， 每 一 轮 中 ， 在 所 有 不 破坏 可 行 性 条 
件 的 可 被 移 除 的 竞拍 者 集合 中 ， 分 配 规 则 移 除 得 分 最 高 的 那个 竞拍 者 。 
考虑 满足 如 下 两 个 属性 的 赋 分 函数 。 首 先 ， 苋 拍 者 i 的 分 数 与 其 余 的 竞拍 
者 的 竞价 无 关 ( 分 数 可 以 与 竞拍 者 i、i 的 欧 价 、 已 退出 拍卖 的 竞拍 者 的 竞 
价 以 及 剩余 的 竞拍 者 有 关 )。 其 次 ， 固 定 其 他 竞拍 者 的 竞价 ， 苋 拍 者 i 的 分 
数 与 i 的 竞价 成 正比 。 证 明 使 用 此 赋 分 函数 的 延迟 分 配 算 法 是 单调 的 : 对 
每 个 竞拍 者 i 和 其 他 竞拍 者 的 竞价 组 合 b-;， 如 果 竞 拍 者 i 以 竞价 b; 获胜 
了 ， 那 么 对 于 任意 bi <b, TMA b 竞价 也 会 获胜 。 


在 一 个 直接 显示 机 制 中 ， 如 果 对 于 任意 竞拍 者 子 集 C， 任 意 不 在 集合 C 的 竞 

拍 者 的 竞价 组 合 b-。， 以 及 C 集 合 里 的 竞拍 者 的 真实 估 值 w:， 不 存在 竞价 组 

合 be 使 得 C 中 的 每 个 竞拍 者 都 获得 比 真实 报告 估 值 ve 严格 高 的 收益 ， 那 么 

我 们 就 称 此 机 制 是 弱 防 群体 策略 (weakly group-strategyproof) 的 。 

(a) 在 与 练习 8.3 中 的 场景 和 假设 相同 的 情况 下 , 证 明 对 应 的 DSIC 机 制 
是 弱 防 群体 策略 的 。 

(b) 证 明 在 问题 4. 3 中 定义 的 “前 向 贪心 ”DSIC 机 制 不 是 弱 防 群体 策略 的 。 
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问题 8. 2 在 与 练习 8. 3 中 的 场景 和 假设 相同 的 情况 下 ， 给 出 一 个 DSIC 机 制 的 价格 
递 升 的 实施 。 此 价格 递 升 的 实施 不 接受 直接 报价 。 它 应 该 以 轮 次 的 形式 进 
行 ， 在 每 一 轮 中 ， 机 制 会 提供 给 剩余 的 竞拍 者 一 个 “要 么 接受 , 要么 退 
出 ”的 出 价 。 证 明 如 下 直接 的 竞拍 策略 对 每 个 竞拍 者 而 言 都 是 一 个 占 优 策 
略 : 当 且 仅 当 机 制 的 出 价 超过 竞拍 者 的 私有 估 值 时 才 选 择 进 入 下 一 轮 。 证 
明 当 竞拍 者 们 采用 直接 的 竞拍 策略 时 ， 价 格 递 升 的 实施 得 到 的 最 终结 果 和 
采用 直接 显示 DSIC 机 制 得 到 的 结果 一 样 。 为 了 简化 分 析 ， 你 可 以 假设 所 
有 的 估 值 和 赋 分 都 是 正 整数 并 且 不 超过 一 个 已 知 的 数 wmax。 

问题 8. 3 〈H) 证 明 当 每 个 竞拍 者 都 是 单 物 品 需求 时 (练习 7.5), 任何 组 合拍 卖 中 都 
存在 瓦尔 拉 斯 均衡 。 


第 9 章 | 


Twenty Lectures on Algorithmic Game Theory 


会 支付 约束 的 机 制 设 计 





第 2 章 介绍 了 拟 线性 效用 模型 ， 模 型 中 的 每 个 智能 体 旨 在 最 大 化 给 定局 势 中 的 佑 
值 (此 值 比 他 的 支付 要 大 )。 除 了 最 基本 的 条 件 外 ， 比 如 支付 是 非 负 的 、 说 真 话 的 竞拍 
者 保证 不 会 有 负 的 收益 ， 我 们 对 竞拍 者 的 支付 没有 任何 其 他 限制 。 在 本 章 中 ， 除 了 常 
规 的 激励 和 可 行 性 约束 外 ,我们 首次 考虑 含有 支付 约束 的 机 制 设计 问题 。 

9.1 节 把 拟 线性 收益 模型 扩展 到 含有 预算 约束 的 场景 ; 9.2 节 研 究 竞 拍 者 有 预算 
约束 时 的 多 物品 拍卖 ,并 提出 一 个 优美 但 非 DSIC 的 解决 方案 : 同一 价格 拍卖 ; 在 
9. 3 节 ， 针 对 同样 的 问题 ， 我 们 给 出 一 个 更 复杂 但 却 是 DSIC 的 机 制 一 一 锁定 拍卖 ; 
9.4 节 考虑 不 含 任何 支付 的 机 制 设 计 问 题 ， 辐 时 引入 了 经 典 的 房屋 分 配 问题 ， 并 且 研 
究 了 首位 交易 环 算法 的 性 质 。 


9. 1 预算 约束 


在 很 多 应 用 中 ， 机 制 能 收 上 来 的 钱 是 被 限制 了 的 。 头 号 证 据 就 是 竞拍 者 有 预算 约 
R (budget constraint) ， 即 约束 了 竞拍 者 所 能 支配 的 钱 。 在 那些 竞拍 者 需要 购买 大 量 
物品 的 拍卖 里， 预算 显得 非常 重要 。 比 如 ， 在 关键 字 搜索 拍卖 中 (2.6 节 )， 每 个 药 拍 
者 需要 上 报 每 次 点 击 报价 以 及 每 日 的 预算 。 这 些 报 价 和 预算 能 很 好 地 对 参与 拍卖 的 人 
群 进 行 建 模 ， 特 别 是 当 拍 卖 的 物品 都 是 相同 的 时 候 。 
把 预算 整合 进 效 用 模型 里 的 最 简单 的 方式 如 下 : 给 定 结果 w MA B, 以 及 支付 
p;， 重 新 定义 智能 体 i 的 效用 为 
vilw)— pi Pi SB, 
—2o py > B 
一 个 自然 的 泛 化 效用 模型 (本 节 中 我 们 不 讨论 ) 是 定义 一 个 与 超过 预算 的 值 成 正比 
的 代价 函数 。 
为 了 满足 预算 约束 ， 需 要 设计 新 的 拍卖 形式 。 例 如 ， 考 虑 简单 的 单 物品 拍卖 ， 每 
个 竞拍 者 都 有 一 个 已 知 为 1 的 预算 和 一 个 私有 估 值 。 二 价 拍卖 向 赢家 收取 次 高 报价 ， 
这 个 价格 有 可 能 超过 赢家 的 预算 。 更 一 般 地 ， 同 时 满足 竞拍 者 的 预算 约束 以 及 社会 福 
利 最 大 化 的 DSIC 单 物 品 拍卖 ( 非 负 支付 ) 是 不 存在 的 (问题 9. 1)。 
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9.2 同一 价格 多 单位 拍卖 


9.2.1 多 单位 拍卖 


在 多 单位 拍卖 (multi-unit auction) 中 ， 有 mx 个 相同 的 物品 ， 每 个 竞拍 者 对 获得 的 
每 个 物品 都 有 一 个 私有 估 值 v;。 不 像 在 例 3.2 中 的 & 单 位 拍卖 ， 在 这 里 我 们 假设 每 个 
竞拍 者 想 要 尽 可 能 多 的 物品 。 因 此 竞拍 者 i 对 获得 & 个 物品 的 估 值 是 &k， wv;。 这 种 多 
单位 拍卖 场景 属于 单 参数 环境 (3. 1 节 )。 最 后 ， 假 设 每 个 竞拍 者 都 有 一 个 公开 的 ( 即 
卖家 事先 知道 的 ) 预算 B,。” 


9.2.2 同一 价格 拍卖 


我 们 考虑 的 第 一 个 多 单位 拍卖 是 以 “市 场 清仓 价格 ”把 物品 分 配 出 去 ( 即 “ 供 需 平 
衡 ” 时 的 价格 ) 。 供 应 量 是 物品 的 数量 六 。 每 个 竞拍 者 的 需求 由 价格 决定 ， 价 格 越 高 需 
RRD, ÉRE, ELEME i 在 价格 p 下 的 需求 量 (demand of bidder i at price 力 ) 为 : 


n B 
min{| — Js < v; 
Den -| |B fom ° (9.1) 


0 p> t; 
由 于 每 个 竞拍 者 i 对 每 个 收 到 的 物品 估 值 为 v;。 如 果 价 格 高 过 vw;， 那么 他 不 想 要 
任何 物品 ( 即 D,(p)=0); 如 果 价 格 低 于 立 ， 他 想 要 他 能 负担 得 起 的 尽 可 能 多 的 物品 


( 即 p.<p)=min|| 2|, mJ). 当 y=p 时 ， 只 要 满足 预算 约束 ， 竞拍 者 并 不 关心 他 
获得 多 少 物品 。 拍 卖 可 以 以 随机 的 方式 打破 平局 ， 此 外 D (w ) 可 以 为 0 到 min 
(2| om \ 2 A EE Re C4 AH 


随 着 价格 p 的 增加 ， 需 求 D,;(p) 会 减少 ， 即 从 D,(0)=m wh BD, (ce) 一 0。 注 
意 需求 量 中 的 减少 有 两 种 形式 : 要 么 从 一 个 任意 的 正 整数 减少 到 0( 当 p 超过 vi 时 )， 





要 么 只 减少 一 个 单位 物品 ( 当 | 人 | 减少 1 时 )。 

对 于 一 个 与 所 有 竞拍 者 估 值 都 不 一 样 的 价格 p， 定 义 总 需求 (aggregate demand) 为 
A(p) = 2》)D;(p)。 一般 的 ， EMA (p) = lim 97 Di(q) 以 及 At (p) = lim $ D,(q). 
i=1 $TP j= OVP i=l 

分 别 对 应 A(p) 从 下 方 和 从 上 方 取 极 限时 的 值 。 
O 我 们 非常 想 假设 预算 也 是 秘 有 的 ， 也 是 可 以 虚报 的 。 但 是 私有 的 预算 约束 会 使 得 机 制 设计 问题 变 得 


很 困难 ， 甚 至 在 某 些 场景 下 不 可 能 实现 ( 另 见 练习 9. 3) 。 此 外 ， 公 开 预 算 这 个 特殊 场景 会 得 到 一 些 优 
美的 并 且 潜 在 可 用 的 拍卖 形式 ， 这 是 我 们 所 作 努 力 的 全 部 意义 。 








同一 价格 拍卖 挑选 一 个 价格 p 使 得 供应 量 和 总 需求 相等 。 并 且 分 配给 每 个 竞拍 者 
在 价格 p 时 的 需求 量 。 





同一 价格 拍卖 
1. 选 定 p 使 得 供应 量 等 于 总 需求 ， 即 A (p) 宇 m 宇 A (p). 
2. 把 D;(p) 个 物品 分 配给 竞拍 者 i， 其 中 每 个 物品 价格 为 p。 当 wi 二 Pp 时， 定义 竞 
拍 者 i 的 需求 量 D;(p) 为 使 得 m 个 物品 都 被 分 配 出 去 的 量 。 











虽然 我 们 把 同一 价格 拍卖 描述 成 一 个 直接 显示 机 制 , 但 相应 地 ， 也 有 一 个 价格 递 
升 的 实施 。 


9.2.3 同一 价格 拍卖 不 是 DSIC 的 


好 消息 是 ， 定 义 9. 1 中 的 D;(p) 使 得 同一 价格 拍卖 满足 所 有 竞拍 者 的 预算 约束 。 
坏 消息 是 这 个 拍卖 不 是 DSIC 的 。 与 同时 升 价 拍卖 一 样 ， 它 也 面临 着 需求 缩减 的 问题 
(8.3.3 47). 

例 9. 1( 需 求 缩减 ) 假设 有 两 个 物品 和 两 个 竞拍 者 ，B = 十 cc, vy =6, B= 
v2 一 5。 如 果 两 个 竞拍 者 都 真实 竞价 ， 那 么 总 需求 A(p) 在 价格 到 达 5 之 前 至 少 是 3， 
在 价格 为 5 时 ，D1(5) 二 2，D;(5) 二 0。 因此 同一 价格 拍卖 会 把 两 个 物品 全 都 分 配给 
第 一 个 竞拍 者 ， 此 竞拍 者 为 每 个 物品 支付 的 价格 为 5， 获 得 2 的 收益 。 如 果 第 一 个 竞 
拍 者 虚假 报价 为 3， 他 可 以 获得 更 高 的 收益 。 原 因 在 于 第 二 个 竞拍 者 的 需求 量 在 价格 
为 5/2 时 减少 到 1( 他 不 能 同时 负担 得 起 两 个 物品 ) 并 且 拍 卖 会 将 在 价格 为 3 时 结束 。 
此 时 Di(3) 王 1， 第 一 个 竞拍 者 获得 一 个 物品 ， 但 是 支付 仅 为 3， 因此 他 的 收益 为 3， 
这 比 在 真实 报价 时 要 高 。 

我 们 能 够 修改 同一 价格 拍卖 使 得 其 恢复 DSIC 吗 ? 因为 同一 价格 拍卖 的 分 配 规则 
是 单调 的 ， 所 以 我 们 可 以 把 支付 价格 替换 为 由 迈 尔 森 引 理 (定理 3.7) 导 出 的 关键 价 
格 。 为 了 获得 仍然 拥有 良好 性 质 的 且 满 足 DSIC 的 多 单位 拍卖 ， 在 下 一 节 中 我 们 同时 
修改 同一 价格 拍卖 的 分 配 和 支付 规则 。 


“9.3 锁定 拍卖 


在 竞拍 者 存在 公开 预算 约束 时 ， 锁 定 拍 卖 (clinching auction) 是 一 个 DSIC 的 多 单 
位 拍卖 9S 。 拍 卖 的 关键 点 在 于 随 着 价格 的 升 高 ， 逐 个 把 物品 卖 出 去 。 除 了 当前 价格 p 





O 同样 ， 这 里 给 出 一 个 直接 显示 机 制 的 描述 ， 但 是 存在 一 个 自然 的 价格 递 升 的 实施 。 
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之 外 ,拍卖 还 一 直 追 踪 当 前 的 供应 量 s( 初 始 为 m) 以 及 每 个 竞拍 者 的 剩余 预算 B,( 初 始 
为 B,)。 在 价格 pu 时 ， 基于 剩余 预算 和 供应 量 ,， 仿照 式 (9. 1)， 竞拍 者 i 的 剩余 需 


求 量 万 ,( 户 定义 为 : 
r min{| Ê | py; 
Dp) = p (9.2) 


0 p> 
定义 DD (p) =limÂ, (q). 
锁定 拍卖 迭代 地 提高 当前 价格 p， 只 要 在 价格 p 下 不 存在 竞争 ， 也 就 是 说 当 其 他 
人 总 的 需求 量 严 格 小 于 当前 供应 量 s 时 ， 那么 竞拍 者 i 就 会 “锁定 ” 某 些 物 品 。 不 同 
的 物品 会 以 不 同 的 价格 在 不 同 轮 次 中 被 卖 掉 。 拍 卖 一 直 持 续 到 所 有 物品 都 被 卖 出 时 才 
结束 。 





锁定 拍卖 
ie p=0. s=m, A EHH WB, =B: 
while s>0 时 do 
增加 力 至 ui RAB/k PHKE Ak AER ERR) 
设 i 为 拥有 最 大 剩余 需求 户 ;(p) 的 竞拍 者 ， 以 随机 策略 打破 平局 
while >) D} (p) < s do 


if >) Ôi (p) > s then 
j=1 


以 价格 p 分 配给 竞拍 者 i 一 个 物品 /这 个 物品 被 “锁定 ”了 

EÊ 减少 p，s 减少 1 

在 价格 p 下 ,重新 计算 出 拥有 最 大 剩余 需求 的 i， 以 随机 策略 
打破 平局 





else if 5) 方 (p) < s then 
j=l 


以 价格 p PED, ( 力 ) 个 物品 给 竞拍 者 
把 任意 剩余 物品 以 价格 记分 配给 满足 v= 二 p 的 竞拍 者 / 
把 于 置 为 0 








仅 与 拍卖 相关 的 价格 发 生 在 竞拍 者 的 剩余 需求 发 生 减 少 的 时 候 。 对 某 个 竞拍 者 i 
和 正 整数 & 而 言 ， 这 样 的 价格 要 么 满足 p=v, BAW p—B/k. HT fa PL. B 
设 拍卖 中 所 有 v 和 户 , 人 表示 的 值 都 是 不 一 样 的 。 





在 内 层 循环 里 ， 存 在 两 种 情况 。 在 第 一 种 情况 下 ， 总 的 剩余 需求 超过 剩余 供应 
E, 但 是 除 竞 拍 者 i 外 的 其 他 竞拍 者 的 总 剩余 需求 量 小 于 剩余 供应 量 。 在 这 种 情况 
下 ， 我 们 称 竞 拍 者 i 以 价格 zp“ 锁定 ”一 个 物品 ， 并 且 相 应 地 更 新 i 的 预算 。 总 的 剩 
REA 的 剩余 需求 都 减少 1 。 

第 二 种 情况 只 有 当 总 需求 量 X) D) O 在 价格 为 时 减少 两 个 或 者 更 多 时 才 会 发 
Æ. BEIA B, /k 表示 的 值 都 是 不 一 样 的 ， 这 种 情况 只 有 当 p 等 于 wv 时 才 会 发 生 (1 
为 某 个 竞拍 者 )。 在 这 种 情况 下 ， 当 /的 需求 量 降 为 0 t, RRK s 个 物品 之 间 不 存在 
竞争 ， 因 此 所 有 竞拍 者 的 剩余 需求 都 被 同时 满足 了 。 在 满足 竞拍 者 剩余 需求 后 ， 有 可 
能 还 有 物品 剩余 ， 这 时 我 们 把 它们 分 配给 无 差别 对 待 的 竞拍 者 1( 以 价格 p=). 

例 9. 2( 无 需求 缩减 ) 让 我 们 重新 回顾 例 9. 1; 有 两 个 物品 和 两 个 竞拍 者 ， 其 中 ， 
Bi 一 十 ce, wi 一 6，B, 王 vw, 二 5。 假 设 两 个 竞拍 者 都 真实 竞价 。 在 同一 价格 拍卖 中 
( 例 9.1)， 第 一 个 竞拍 者 会 以 单价 5 获得 两 个 物品 。 在 锁定 拍卖 中 ， 由 于 第 二 个 竞拍 
者 的 需求 D,(p) 在 价格 p 到 达 5/2 时 减少 到 1， 此 时 第 一 个 竞拍 者 会 以 价格 5/2 锁定 
一 个 物品 。 和 以 前 一 样 ， 第 二 个 物品 以 价格 5 卖 给 第 一 个 竞拍 者 。 最终 当真 实 竞 价 
时 ， 第 一 个 竞拍 者 的 收益 为 9/2， 并 且 虚 报 竞价 不 能 做 到 更 好 (定理 9.4)。 

练习 9. 1 要 求 你 证 明 如 下 命题 。 

命题 9. 3( 锁 定 拍卖 是 可 行 的 ) ”锁定 拍卖 总 会 结束 ， 且 完全 分 配 mm 个 物品 ， 收 取 
的 支付 最 多 是 竞拍 者 的 预算 。 

接 下 来 我 们 证 明 锁 定 拍卖 是 DSIC 的 。 

定理 9. 4( 锁 定 拍卖 是 DSIC 的 ) 在 竞拍 者 拥有 公开 的 预算 约束 时 ， 锁 定 拍 卖 是 
DSIC 的 。 

证 明 : 我 们 可 以 验证 拍卖 的 分 配 规则 是 单调 的 ， 并且 支付 符合 迈 尔 森 支付 公 
式 (3.5)， 不 过 直接 验证 拍卖 是 DSIC 的 更 容易 一 些 。 固 定 一 个 竞拍 者 i 和 其 他 竞拍 者 
的 竞价 b_;。 由 于 竞拍 者 i 的 预算 是 公开 的 ， 所 以 i 不 能 影响 剩余 需求 DD，(p) 里 的 
LB,/p 项。 他 只 能 影响 他 退出 拍卖 的 时 间 ， 也 即 户 ; (p) =0 的 时 刻 。 当 p 二 vw 时， 
每 个 被 竞拍 者 i 锁定 的 物品 都 会 增加 i 的 收益 ; 同时 当 pu 时 ， 每 个 锁定 的 物品 会 
减少 i 的 收益 。 真 实 报价 保证 了 非 负 的 收益 。 

首先 ,我们 比较 报价 o 和 报价 56; 二 vw; 时 的 收益 大 小 。 想 象 我 们 并 行 地 运行 两 场 
锁定 拍卖 ,一 场 的 报价 是 v 一 场 的 报价 是 b;。 通 过 对 迭代 次 数 的 归纳 ， 我们 知道 ， 
当 价 格 p 从 0 升 高 到 6; 时， 两 场 锁定 拍卖 的 执行 过 程 都 是 一 样 的 。 因 此 ， 通 过 报价 
6b;， 竞 拍 者 只 可 能 会 错失 一 些 在 价格 p 属于 [6b,，w | 时 能 够 锁定 的 物品 ( 带 来 非 负 的 
收益 )。 

类 似 地 ， 如 果 :竞价 ;二 ww， 仅 有 的 变化 是 他 可 能 在 价格 p 属于 Lv;，b;] 时 获得 一 
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些 额 外 的 物品 ， 而 这 些 物品 只 能 带 来 非 正 的 收益 。 因 此 没有 一 个 虚假 报价 会 使 得 i 获 
得 比 真实 报价 更 高 的 收益 。 m 
如 果 预 算是 私有 信息 ， 那 么 使 用 上 报 的 预算 运行 锁定 拍卖 就 不 再 满足 DSIC( 练 
yO. 2) 
由 锁定 拍卖 得 出 的 分 配 在 某 种 意义 上 算是 “好 ”的 吗 ? (如 果 只 有 DSIC 是 重要 
约束 的 话 ， 那 么 我 们 完全 可 以 把 所 有 物品 免费 地 随机 分 配给 一 个 竞拍 者 .) 有 一 些 方法 
可 以 对 这 个 问题 进行 建 模 分 析 ， 详 情 参见 说 明 。 


94 不 含 钱 机 制 设 计 


在 很 多 重要 的 应 用 里 ， 激 励 问 题 很 重要 ， 但 同时 金钱 的 参与 却 是 不 可 行 甚至 是 非 
法 的 。 在 这 些 场景 下 ， 实 际 上 所 有 智能 体 的 预算 都 为 零 。 在 设计 和 理解 诸如 投票 、 器 
官 捐献 和 择 校 等 问题 上 ， 不 含 钱 机 制 设计 就 显得 尤为 重要 。 在 不 使 用 金钱 的 情况 下 ， 
机 制 设计 者 所 能 施展 的 空间 被 束缚 了 ， 甚 至 比 含有 预算 约束 时 的 情况 束缚 得 更 紧 。 尽 
管 存 在 这 些 限 制 并 且 在 一 般 场 景 下 存在 一 些 非常 强 的 不 可 能 性 结果 ， 但 是 机 制 设计 领 
域 里 的 一 些 最 经 典 的 应 用 都 是 不 含 钱 的 。 

一 个 代表 性 的 例子 是 房屋 分 配 问 题 (house allocation problem), @ n 8 EK, 
初始 时 ， 每 个 智能 体 都 拥有 一 栋 房 子 。 每 个 智能 体 的 偏好 信息 由 其 对 这 nn 个 房子 的 一 
个 全 排序 而 不 是 估 值 来 表示 。 对 每 个 智能 体 而 言 ， 我 们 并 不 要 求 其 更 偏好 于 自己 的 房 
子 。 那 么 如 何 巧妙 地 重新 分 配 房屋 使 得 每 个 智能 体 的 情况 都 变 得 更 好 ? 问题 的 一 个 答 
案 是 首位 交易 环 算法 (Top Trading Cycle algorithm, TTC 算法 ) 。 


| 首位 交易 环 算 法 (TTC 算法 ) 
初始 化 N 为 所 有 智能 体 的 集合 


while NO do 
构建 一 张 有 向 图 G， 其 中 顶点 集 为 N， 边 集 为 {(i，L): i 最 喜欢 的 房子 ( 排 在 
序列 首位 的 房子 ) 被 N 中 的 1 拥有) 
计算 图 G 中 的 有 向 环 Ci1，*…，C 9// 自 环 也 算 在 内 ， 并 且 所 有 环 都 不 相交 
for 每 个 环 Cis s C 中 的 每 一 条 边 (i, L) do 
重新 分 配 ! 的 房子 给 智能 体 i 
从 集合 N 中 移 除 Ci，…，C 中 的 智能 体 

















O G 中 至 少 有 一 个 有 向 环 ， 这 是 因为 遍历 一 组 出 边 序列 最 终 一 定 会 经 过 一 个 重复 的 点 。 又 因为 所 有 项 点 
的 出 度 为 1， 因 此 所 有 这 些 环 都 是 不 相交 的 。 
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下 面 的 引 理 对 理解 算法 的 性 质 非 常 重要 ， 该 引 理 可 以 通过 TTC 算法 的 描述 直接 
得 到 。 

引 理 9.5 用 Ji 表示 TITC 算 法 在 第 上 尺 次 和 迭代 中 被 移 除 的 智能 体 集 合 。 除 了 被 
NiU…UNei 拥 有 的 房屋 外 ， 每 个 在 Ni 中 的 智能 体 都 获得 了 剩余 房屋 中 他 最 喜欢 的 
那个 ， 并 且 这 个 房屋 的 原始 拥有 者 也 在 Ne 中 。 

例 9.6(TTC 算法 ) 设 N={1，2，3,，4)， 并 且 每 个 人 都 最 喜欢 智能 体 1 的 房 
子 ， 智 能 体 2、3、4 第 二 喜欢 的 房子 分 别 被 智能 体 3、4、2 拥有 。( 剩 余 没 列 出 的 偏 
好 信息 对 本 例 没有 影响 ) 图 9. la 描绘 了 TTC 算法 在 第 一 轮 和 迭代 中 的 图 G。 图 中 只 有 
一 个 环 ， 即 智能 体 工 的 自 环 。 使 用 引 理 9. 5 的 符号 ， 我 们 有 Ni 二 {1)。 图 9. 1b 表示 
当 把 智能 体 1 和 他 的 房子 移 除 后 ，TTC 算法 在 第 二 轮 形 成 的 图 。 现 在 所 有 的 智能 体 
都 处 于 同一 个 环 中 ， 并 且 每 个 智能 体 均 获得 了 剩余 智能 体 集 Ni 一 42，3， 4} 中 他 最 喜 
欢 的 房子 。 





a) 第 一 轮 b ) 第 二 轮 
图 9.1 首位 交易 环 算法 ( 例 9. 6) 


当 智 能 体 的 总 排序 是 私有 信息 时 ， 我 们 可 以 考虑 直接 显示 机 制 ， 首 先 机 制 收取 每 
个 智能 体 各 自 的 排序 信息 ， 然 后 调用 TTC 算法 。 在 此 机 制 中 ， 每 个 智能 体 都 没有 动 
机 虚报 他 的 偏好 信息 。 

定理 9.7(TTC 算法 是 DSIC 的 ) TTC 算法 导出 一 个 DSIC 的 机 制 。 

证 明 : 固定 智能 体 i 和 其 他 智能 体 上 报 的 信息 。 按 照 引 理 9.5 定义 N,， 假 设 i 真 
实 报 告 信息 且 i€ N;。 证 明 的 要 点 在 于 任何 虚报 都 不 能 让 i 获得 N,U…UN;_1 里 的 房 
屋 。 在 循环 R=1, 2, =, j 一 1 里 , 不 存在 智能 体 EN, 指向 i 的 房子 一 一 否则 的 
话 ，i 和 会 属于 同一 个 有 向 环 ; 此 时 ,i 会 在 N， MAREN, 里 。 同 时 也 不 存在 属于 
Ne 的 智能 体 在 第 & 次 迭代 前 指向 i 的 房子 一 一 如 果 有 的 话 ， 那 么 他 会 在 第 轮 中 依 
旧 指 向 i 的 房子 。 因 此 ,不管 智能 体 i 报告 什么 ， 他 都 不 能 加 入 到 含有 N Ue UN, 
的 环 。 引 理 9. 5 表明 他 没有 动机 虚报 。 = 

定理 9.7 的 内 容 本 身 没什么 亮 眼 的 。 例 如 ， 不 进行 任何 重 分 配 的 机 制 也 是 DSIC 
的 。 但 是 接 下 来 的 结论 表明 在 某 种 意义 上 ，TTC 算法 是 “最 优 的 ”。 
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考虑 如 下 分 配 : 每 个 智能 体 分 配 一 个 不 同 的 房屋 ; 给 定 一 个 智能 体 子 集 ， 如 果 他 
们 可 以 在 该 子 集 内 重新 分 配 原 始 的 房屋 使 得 某 些 成 员 的 情况 变 得 更 好 且 没 有 成 员 比 以 
前 更 差 ， 那么 就 称 此 智能 体 子 集 在 这 个 分 配 中 形成 一 个 阻塞 联盟 (blocking coalition) 。 
例如 ， 在 一 个 配置 中 ， 如 果 智 能 体 i 获得 了 比 他 初始 拥有 的 房屋 更 差 的 一 个 房屋 时 ， 
{引子 集 形成 了 一 个 阻塞 联盟 。 核 心 配置 (core allocation) 是 指 不 存在 阻塞 联盟 的 分 配 。 

定理 9. 8(TTC 算法 和 核心 配置 ) ”对 任何 房屋 分 配 问 题 ， 由 TTC 算法 得 到 的 分 
配 是 唯一 的 核心 配置 。 

证 明 ; 我 们 首先 证 明 仅 可 能 有 的 核心 配置 一 定 是 由 TTC 算法 得 到 的 那个 。 按 引 
理 9. 5 定义 集合 Nt。 在 TTC 分 配 中 ，Ni 中 的 智能 体 获 得 了 他 的 首选 项 ， 因 此 对 于 
任意 一 个 与 TTC 算法 在 集合 N 上 有 不 同 配 置 的 分 配 来 说 ，Ni 形成 了 一 个 阻塞 联 
H. AWA. 在 TTC 分 配 中 ， 所 有 N: 中 的 智能 体 获 得 了 除 N 外 的 最 佳 房屋 选择 
( 引 理 9.5)。 由 于 任何 核心 配置 都 必须 在 Ni 的 配置 中 与 TTC 分 配 保持 一 致 ， 那 么 核 
心 配置 也 必须 与 TTC 算法 在 No 中 的 分 配 保持 一 致 一 一 否则 的 话 ，N; 将 形成 一 个 阻 
塞 联盟 。 继 续 归 纳 ， 我 们 可 以 断定 任何 与 TTC 配置 不 同 的 分 配 都 不 是 核心 配置 。 

为 了 验证 TTC 分 配 是 一 个 核心 配置 ， 考 虑 任何 一 个 智能 体 子 集 S 和 一 个 在 集合 S 
内 部 的 房屋 重 分 配 。 这 个 房屋 的 重新 配置 把 S 分 成 一 些 不 相交 的 有 回环 。 如 果 在 某 个 这 
样 的 环 中 存在 来 自 两 个 不 同 N; 集合 中 的 智能 体 ， 那 么 此 环形 成 的 重 分 配 中 肯定 存在 至 
少 一 个 来 自 N, 的 智能 体 i， 他 获得 了 某 个 来 自 N, 中 的 某 个 智能 体 的 房屋 (! 二 门 ， 从 
而 导致 了 i 获得 了 比 在 TTC 分配 中 更 差 的 房屋 ( 引 理 9.5)。 类 似 的 ， 对 于 包含 于 N: 
的 环 ， 如 果 智 能 体 没 有 收 到 在 N, 中 他 最 喜欢 的 房子 ， 那 么 他 都 将 获得 一 个 不 如 TTC 
分 配 的 房子 。 总 结 可 得 ， 如 果 S 中 房屋 的 一 个 重 分 配 和 TTC 算法 得 到 的 分 配 不 同 ， 
那么 S 中 肯定 存在 某 个 智能 体 获 得 了 不 如 TTC 分 配 的 房子 。 由 于 集合 S 是 任意 的 ， 


所 以 TTC 分 配 中 不 存在 阻塞 联盟 也 就 是 说 TTC 分 配 一 定 是 一 个 核心 配置 。 m 
总 结 


e 在 很 多 重要 的 机 制 设计 问题 中 ,支付 是 被 限制 或 者 是 禁止 使 用 的 。 支 付 约束 
会 使 得 机 制 设计 变 得 非常 困难 。 

e 在 带 预 算 约束 的 多 单位 同 质 物品 拍卖 中 ， 同 一 价格 拍卖 以 到 达 供 需 平衡 的 价 
格 把 所 有 物品 以 相同 价格 卖 出 去 。 

e 锁定 拍卖 是 一 个 更 复杂 的 拍卖 ， 它 以 递增 的 价格 把 物品 逐个 卖 出 。 与 同一 价 
格 拍卖 不 同 ， 锁 定 担 卖 是 DSIC 的 。 

© 首位 交易 环 算法 (TTC 算法 ) 是 一 个 重新 分 配 智能 体 所 拥有 物品 的 方法 (每 个 智能 
体 都 初始 拥有 一 个 物品 )， 并 且 该 算法 尽 可 能 依据 每 个 智能 体 的 偏好 信息 ,使 其 
获得 物品 的 情况 变 得 更 好 。 
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e TTC 算法 导出 一 个 DSIC 的 机 制 并 且 它 计算 出 了 唯一 的 核心 配置 。 


说 明 


原始 的 锁定 拍卖 来 自 Ausubel(2004)， 是 VCG 机 制 在 无 预算 约束 ， 逐 次 递减 估 
值 多 单位 物品 拍卖 中 的 一 个 价格 递 升 的 实施 ( 见 问 题 9. 2) 。 本 章 中 的 版 本 (公开 预算 
约束 ， 单 物品 常数 估 值 ) 来 自 Dobzinski 等 (2012) 。 

有 一 些 方式 可 以 说 明 锁 定 拍 卖 在 某 种 意义 上 是 接近 最 优 的 。 第 一 种 方式 是 从 收益 
最 大 化 机 制 (第 5 章 ) 的 角度 考虑 ， 即 在 竞拍 者 估 值 上 假定 一 个 分 布 然后 在 满足 预算 约 
东 条 件 下 求解 最 大 化 期 望 社会 福利 的 DSIC 机 制 。 在 这 种 情况 下 ， 我 们 对 共同 预算 约 
束 的 理解 要 比 一 般 预算 约束 的 理解 要 深刻 一 些 ， 并 且 此 时 锁定 拍卖 可 被 证 明 是 接近 最 
优 的 (Devanur , 2013); 第 二 种 方式 (在 练习 9.4 中 研究 ) 是 修改 社会 福利 目标 函 
数 ， 把 预算 约束 加 进去 ， 即 把 > vr: 替换 为 >)min{B,,viz;) 。 在 此 目标 函数 下 ， 


锁定 拍卖 也 被 证 明 是 接近 最 优 的 (Dobzinski 和 Paes Leme, 2014); 第 三 种 方式 是 研 
究 帕 累 托 最 优 而 不 是 某 个 具体 的 目标 函数 ”。Dobzinski 等 (2012) 证 明了 锁定 拍卖 是 
唯一 的 总 能 获得 帕 累 托 最 优 分 配 的 确定 性 DSIC 拍卖 。 但 请 注意 ,一 些 可 取 的 机 制 ， 
比如 在 第 一 种 方式 里 得 到 的 贝 叶 斯 最 优 机 制 未 必 是 帕 累 托 最 优 的 。 

Shapley 和 Scarf(1974) 定 义 了 房屋 分 配 问 题 ， 并且 把 TTC 算法 归功 于 D. Gale, 
定理 9.7 和 9.8 分别 出 自 Roth(1982b), Roth 和 Postlewaite(1977)。Moulin(1980) 
研究 了 单 峰 偏好 (问题 9. 3) 。 


练习 


练习 9.1 证 明 命题 9. 3。 

练习 9.2 把 锁定 拍卖 和 其 上 的 分 析 扩 展 到 一 般 情况 下 ， 即 估 值 w ABTA B,/k 表示 
的 值 可 以 相同 (& 为 正 整 数 ) 。 

练习 9.3 (HH) 考 虑 一 个 多 单位 物品 拍卖 ， 其 中 每 个 竞拍 者 对 每 个 物品 单位 都 有 一 个 
私有 的 估 值 并 且 还 有 一 个 私有 的 预算 约束 。 证 明 使 用 竞拍 者 上 报 的 估 值 和 
预算 信息 运行 的 锁定 拍卖 不 是 DSIC 的 。 

练习 9. 4 考虑 一 个 单 参数 环境 (3. 1 节 )， 其 中 每 个 竞拍 者 i 有 一 个 公开 的 预算 B;。 
考虑 如 下 分 配 规则 : 给 定 竞 价 组 合 bp， 在 可 行 结果 中 选择 一 个 分 配 使 其 最 





日 ”如 果 不 存在 一 种 对 物品 和 支付 的 重新 配置 使 得 在 不 损害 其 他 人 效用 的 情况 下 ， 某 个 智能 体 ( 一 个 竞拍 
者 或 者 卖家 ) 的 效用 变 得 更 好 (卖家 的 效用 就 是 他 的 收益 )， 那 么 我 们 就 称 此 分 配 是 帕 累 托 最 优 的 。 
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大 化 “截断 福利 ”DJ min{bizx,,B,) 。 当 有 多 组 这 种 结果 时 ， 以 随机 选择 的 


方式 打破 平局 。 

Ca) 证 明 此 分 配 规则 是 单调 的 ; 并 结合 迈 尔 森 引 理 中 的 支付 (公式 (3. 5))， 
证 明 导 出 的 DSIC 的 机 制 满 足 竞拍 者 的 预算 约束 。 

(b) 考虑 一 个 单 物品 场景 。 非 正式 的 讨论 在 一 般 情况 下 ， 由 (a) 得 到 的 拍卖 
往往 会 导致 一 个 “合理 的 ”结果 。 

(c) (HH) 考 虑 一 个 有 m 个 相同 物品 的 多 单位 拍卖 ， 其 中 每 个 竞拍 者 i 对 每 
个 物品 都 有 一 个 私有 的 估 值 ww。 对 于 几乎 所 有 的 可 行 分 配 ， 解释 截 断 
福利 函数 都 会 得 到 相同 的 值 ， 进 而 说 明 在 (a) 中 的 拍卖 很 容易 就 会 产生 
一 个 “不 合理 的 ”结果 。 

练习 9.5 另外 一 个 用 于 房屋 分 配 问 题 的 机 制 是 随机 序列 独裁 (random serial dicta- 
torship)， 它 出 自 于 学 生 寝室 分 配 问题 。 





随机 序列 独裁 
初始 化 吾 为 所 有 房屋 的 集合 
把 所 有 智能 体 进 行 随机 排序 
for ¿=1, 2, 3, =+, ndo 
PRA HEI REKN REA DSH 
从 HF il BA 











Ca) 试问 不 管 机 制 产生 哪 一 个 随机 序列 ， 对 于 随机 序列 独裁 机 制 而 言 类 似 
定理 9.7 的 结果 是 否 还 成 立 ? 

Cb) 试问 不 管 机 制 产生 哪 一 个 随机 序列 ， 对 于 随机 序列 独裁 机 制 而 言 类 似 
定理 9. 8 的 结果 是 否 还 成 立 ? 


问题 


问题 9. 1 考虑 一 个 拥有 并 个 竞拍 者 的 单 物品 拍卖 ， 每 个 竞拍 者 都 有 一 个 公开 的 预算 
约束 。 
(a) 给 出 一 个 DSIC 的 拍卖 (可 以 是 随机 的 ) 使 得 在 满足 非 负 支付 和 竞拍 者 
预算 约束 的 条 件 下 ， 得 到 的 (期 望 ) 福 利 至 少 为 最 大 估 值 的 1/n。 
(b)(H) 证 明 存 在 常数 c 二 >0， 对 于 任意 大 的 以 及 一 个 合适 的 竞拍 者 预算 


D 一 些 人 偏好 于 使 用 随机 序列 优先 机 制 这 个 不 那么 富有 敌意 的 术语 。 
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问题 9. 2 


问题 9. 3 


组 合 ， 在 任意 一 个 满足 非 负 支付 以 及 竞拍 者 预算 约束 的 DSIC 单 物 品 
拍卖 (可 以 是 随机 的 ) 中 ， 都 存在 一 个 估 值 组 合 使 得 拍卖 得 到 期 望 福利 
至 多 为 最 大 估 值 的 c/n. © 

本 问题 对 本 章 中 的 多 单位 拍卖 从 两 个 角度 进行 修改 。 首 先 ， 为 了 简化 问 

题 ， 假 设 竞拍 者 没有 预算 约束 。 另 外 ， 一 般 化 该 问题 : 不 同 于 每 个 竞拍 者 

对 单个 物品 都 有 一 个 相同 的 估 值 v;， 我们 假设 在 竞拍 者 i 已 经 获得 j 一 1 个 

物品 的 情况 下 ， 他 对 获得 的 第 j 个 物品 有 一 个 私有 的 边际 估 值 v;。 因 此 ， 

MR i 以 整合 后 的 价格 p 获得 了 k 个 物品 ， 他 的 效益 为 (Zv) —p. Ë 

wA A te TF È th (downward-sloping) {ii {A pea. BI aR 15 E BE 

物品 的 收益 递减 : Vy SU Sy So Sun AT fa ea. 假设 所 有 竞拍 

者 的 边际 估 值 都 是 不 一 样 的 。 

(a) 给 出 一 个 简单 的 能 够 实现 VCG 分 配 规则 的 贪心 算法 。 如 果 竞 拍 者 的 
估 值 函数 不 是 向 下 弯 的 ， 那么 给 出 的 算法 是 否 还 有 效 ? 

Cb) 依照 其 他 竞拍 者 上 报 的 边际 估 值 组 合 ， 给 出 竞拍 者 在 VCG 机 制 下 的 
支付 函数 的 简单 刻画 。 

Cc) 通过 恰当 地 重 定义 欧 拍 者 的 需求 函数 ， 修 改 9. 3 节 中 的 锁定 拍卖 至 本 
场景 。 证 明 此 机 制 得 到 的 分 配 和 支付 规则 和 VCG 机 制 里 的 一 样 。 

考虑 一 个 机 制 设计 间 题 ， 其 中 单位 区 间 [0，1j 是 所 有 可 能 结果 的 集合 并 且 

每 个 竞拍 者 都 有 一 个 单 峰 偏好 (single-peaked preference)， 也 就 是 说 存在 

一 个 针对 智能 体 的 “峰值 ”zx; LO, 1E e< yr MH ae Sy>z 时 ， 

竞拍 者 相 比 于 zz 严格 偏好 于 y。 因 此 单 峰 偏 好 的 苋 拍 者 想 要 机 制 的 结果 

尽 可 能 地 靠近 他 偏好 的 峰值 。° 

(a) 以 上 报 峰 值 的 平均 值 作为 输出 的 机 制 是 DSIC 的 吗 ? 

Cb) 以 上 报 峰 值 的 中 位 数 作为 输出 的 机 制 是 DSIC 的 吗 ? 可 以 先 假设 竞拍 
者 的 人 数 是 奇数 。 

(Cc) CH) 上 面 的 两 个 机 制 都 是 匿名 的 (anonymous)， 也 就 是 说 机 制 产生 的 
结果 只 基于 上 报 峰 值 的 无 序 排列 而 不 是 基于 特定 智能 体 的 特定 峰值 。 
这 两 个 机 制 也 是 满 射 的 (onto)， 即 对 任意 zxELO，1]j， 存 在 一 个 上 报 
的 偏好 组 合 使 得 机 制 的 输出 是 zx。 对 于 个 智能 体 ， 你 能 找到 超过 
个 同时 满足 确定 性 、DSIC、 匿 名 性 、 满 射 性 的 不 同 的 直接 显示 机 
制 吗 ? 





© 随机 DSIC 机 制定 义 在 问题 6.4 中 。 
© ”政治 派别 是 对 区 间 [0，1] 的 一 个 自然 解释 一 一 从 激进 派 到 保守 派 ， 
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缘 脏 交换 和 稳定 匹配 





本 章 是 有 关机 制 设 计 的 最 后 一 讲 ， 涵 盖 了 不 含 钱 机 制 设计 里 的 一 些 典 型 应 用 。 在 
过 去 数 十 年 里 ， 机 制 设计 里 的 一 些 思想 深 深 地 影响 了 肾脏 交换 (10. 1 节 里 的 案例 分 
析 )， 这 些 交 换 在 每 一 年 里 都 成 功 促成 了 成 千 上 万 次 肾脏 移植 。 稳 定 匹 配 以 及 著名 的 
延迟 接受 算法 (10. 2 节 ) 构 成 了 许多 分 配 问题 的 算法 基础 ， 包 括 住院 医师 与 医院 的 匹 
配 问 题 ， 学 生 与 学 校 的 匹配 问题 。 与 此 同时 ， 延 迟 接受 算法 还 有 着 优美 的 数学 性 质 和 
激励 保证 。 


10.1 案例 分 析 : 肾脏 交换 


10.1.1 背景 


一 些 人 肾脏 衰竭 并 急需 肾脏 移植 。 在 美国 ， 有 超过 100 000 人 在 等 待 着 肾脏 移 
植 。 一 个 传统 的 通常 也 用 在 其 他 器 官 上 的 做 法 是 使 用 遗体 捐赠 人 的 器 官 ( 当 某 些 人 死 
亡 并 且 是 已 注册 的 遗体 捐赠 人 时 ， 他们 的 器 官 会 被 移植 给 其 他 人 )。 与 其 他 器 官 不 同 
的 是 ， 每 个 健康 的 人 体 体内 都 有 两 个 肾脏 并 且 只 用 一 个 肾脏 也 能 生存 得 很 好 。 这 种 特 
性 使 得 可 以 使 用 活体 器 官 捐赠 人 的 肾脏 ， 比 如 病人 的 家 庭 成 员 。 

遗憾 的 是 ， 仅 有 活体 肾脏 捐赠 人 往往 还 是 不 够 的 ， 因 为 有 时 病人 - 供 体 对 是 不 兼 
容 的 ， 也 就 是 说 供 体 的 肾脏 有 可 能 在 病人 体内 无 法 正常 运作 。 这 种 不 兼容 性 主要 体现 
在 血型 和 组 织 类 型 的 不 兼容 上 。 例 如 ，O 型 血 的 病人 只 能 从 相同 血型 的 捐赠 人 那里 获 
得 肾脏 ， 类 似 地 ，AB 型 供 体 也 只 能 捐献 给 AB 型 的 病人 。 

假设 病人 Pi 与 他 的 供 体 Di 不 兼容 ， 原因 是 他 们 的 血型 分 别 为 A 和 也 。 再 假设 
P, 和 D: 也 不 兼容 ,但 血型 相反 ， 分别 为 BB 型 和 A 型 (图 10.1), BEP, DOM 
(P,，D; ) 或 许 永 远 都 不 能 得 到 满足 ， 但 是 交换 他 们 的 供 体 似乎 是 一 个 好 主意 一 一 PP 
从 D: 那里 获得 肾脏 ，P; 从 Di 那里 获得 肾脏 。 这 就 是 肾脏 交换 (kidney exchange)。 

21 世纪 初 ， 肾 脏 交 换 只 是 作为 一 种 临时 性 的 策略 ， 并 且 真 正 的 实施 也 不 多 。 这 
些 孤 立 的 成 功 使 得 进行 全 国 性 肾脏 交换 的 需求 变 得 很 明确 ， 即 不 兼容 的 病人 - 供 体 对 
可 以 进行 注册 并 和 其 他 人 进行 匹配 。 那 么 我 们 应 该 怎样 设计 这 样 的 交换 呢 ? 当然 我 们 
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的 目标 是 尽 可 能 多 地 实现 肾脏 匹配 。 





B 型 血 
A 型 血 
图 10.1 一 个 肾脏 交换 示例 。(P ，Di) 和 (P,，D:) 是 不 兼容 匹配 对 。P 从 De 


那里 接受 一 个 肾脏 ， 同 理 P 从 D 那里 接受 一 个 肾脏 


目前 ， 除 了 伊朗 外 ， 在 美国 或 其 他 国家 对 器 官 捐赠 进 行 金钱 补偿 是 非法 的 。 但 
是 肾脏 交换 却 是 合法 的 ， 并且 可 以 很 自然 地 用 不 含 钱 机 制 设计 来 进行 建 模 。 


10. 1.2 使 用 TTC 算法 


可 以 用 房屋 分 配 问题 (9. 4 节 ) 来 建 模 肾脏 交换 吗 ? 想法 是 把 每 一 个 病人 - 供 体 
对 作为 一 个 智能 体 ， 不 兼容 的 活体 供 体 作为 一 个 房屋 。 病 人 对 所 有 供 体 的 总 排序 可 
以 根据 成 功 进行 肾脏 匹配 的 评估 概率 来 定义 ， 可 以 基于 血型 、 组 织 类 型 等 其 他 
因素 。 

使 用 TTC 算法 可 以 找 出 类 似 图 10.2 那样 的 环 。 图 中 的 病人 - 供 体 对 来 自 
图 10. 1， 每 个 病人 指向 最 期 望 的 对 方 。 根 据 所 形成 的 环 来 重新 分 配 供 体 刚 好 对 应 于 
图 10. 1 的 肾脏 交换 。 更 一 般 地 ， 使 用 TTC 算法 重新 把 供 体 分 配给 病人 的 这 种 模式 只 
能 提高 每 个 病人 成 功 进行 移植 的 概率 (定理 9. 8) 。 


图 10.2 一 个 好 的 TTC 算法 案例 。 每 个 圈 代 表 了 一 个 不 兼容 的 病人 - 供 体 对 ， 每 个 箭头 代表 
了 一 次 肾脏 移植 ， 比 如 来 自 第 一 对 里 的 供 体 移植 给 第 二 对 中 的 病人 


使 用 TTC 算法 的 唯一 缺点 是 可 能 会 使 用 很 长 的 环 来 进行 肾脏 重 分 配 ， 例 如 
图 10. 3。 但 是 为 什么 长 环 是 一 个 问题 呢 ? 因为 长 度 为 2 的 环 ( 图 10.2) 就 已 经 需要 4 
场 手术 (两 场 用 来 从 供 体 体内 采集 肾脏 ,两 场 用 来 把 肾脏 移植 到 病人 体内 )。 而 且 ， 这 


日 ”伊朗 不 存在 肾脏 等 待 名 单 绝 非 偶然 。 不 知道 其 他 国家 是 否 最 终 也 会 允许 肾脏 买卖 市 场 . 
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4 场 手术 必须 同时 进行 ， 原 因 是 存在 动机 问题 : 在 图 10.1 中 的 例子 里 ， 如 果 Pl 和 
D: 的 手术 首先 进行 ， 那么 D 有 可 能 会 反悔 捐赠 他 的 肾脏 给 P 。 显 而 易 见 ，P, 不 
公平 地 获得 了 一 个 免费 的 肾脏 。 男 外 ,一 个 更 严重 的 问题 是 Po 依旧 和 以 前 一 样 病 
E, 并 且 由 于 他 的 供 体 D CARRS AA. Alt Po 不 能 参加 后 续 的 肾脏 交换 了 。 
考虑 到 这 些 风险 因素 ， 非 同时 进行 的 手术 在 肾脏 交换 中 几乎 从 来 没有 被 使 用 过 。 由 
于 每 场 手 术 都 需要 一 个 独立 的 手术 室 和 手术 团队 ， 这 个 限制 促使 我 们 要 保持 尽 可 能 短 
的 肾脏 交换 链 。 


图 10.3 TTC 算法 的 一 个 糟糕 的 例子 


把 病人 的 偏好 建 模 成 其 对 所 有 捐赠 人 的 一 个 全 序 是 TTC 方法 存在 的 另外 一 个 缺 
点 。 事 实 上 只 要 满足 兼容 性 ， 病 人 们 并 不 关心 他 们 获得 哪 一 个 肾脏 。 因 此 把 偏好 建 模 
成 一 个 二 值 信息 对 病人 来 说 更 合适 。 


10.1.3 应 用 匹配 算法 


二 值 偏 好 和 较 短 的 重 分 配 链 促使 我 们 采用 图 匹配 算法 。 无 向 图 上 的 一 个 匹配 
(matching) 是 指 一 组 没有 重合 项 点 的 边 集 。 对 于 肾脏 交换 来 说 ， 相 关联 的 图 包含 表示 
不 兼容 病人 - 供 体 对 的 顶点 集 V (一 个 对 代表 一 个 顶点 ) 以 及 一 个 无 向 边 集 ， 其 中 两 个 
顶点 (P!，Di) 和 (P,，D;) 存 在 一 条 无 向 边 ， 当 且 仅 当 P, AD, 兼容 并 且 P: 和 D 兼 
容 。 因 此 ， 图 10. 1 中 的 例子 就 对 应 了 图 10. 4 中 的 无 向 图 。 在 这 个 图 中 的 一 个 匹配 就 
对 应 了 一 个 成 对 的 肾脏 交换 集合 ， 其 中 每 一 对 包含 4 场 同时 进行 的 手术 。 最 大 化 可 兼 
容 的 肾脏 移植 对 的 数目 也 就 对 应 着 最 大 化 一 个 匹配 的 规模 。 


图 10.4 应 用 匹配 算法 。 每 个 圈 代 表 一 个 不 兼容 的 病人 - 供 体 对 ， 每 条 边 代 表 一 个 成 对 发 生 
的 肾脏 交换 ， 即 把 每 个 供 体 的 肾脏 移植 到 另外 一 对 的 病人 体内 





O ”就 像 在 大 多 数 国家 里 买卖 肾脏 是 非法 的 那样 ， 为 肾脏 捐赠 签订 一 个 绑 定 的 协议 也 是 不 合法 的 。 

回 ” 序 贯 手术 可 以 在 一 个 稍微 不 同 的 情况 下 被 使 用 。 其 实 也 存在 着 少量 利他 性 的 活体 捐赠 人 ， 他 们 愿意 
把 肾脏 捐献 给 可 能 他 们 自己 都 不 知道 的 病人 。 一 个 利他 的 活体 捐赠 人 可 以 作为 一 个 重 分 配 链 的 开端 。 
目前 一 个 长 达 30 的 肾脏 交换 链 已 经 被 实施 了 ， 在 这 种 规模 下 ， 我 们 不 得 不 使 用 序 贯 手术 。 并 且 由 于 
捐赠 链 始 于 一 个 利他 的 活体 捐赠 人 ， 所 有 病人 在 得 到 一 个 肾脏 前 没有 失去 自己 对 应 的 活体 捐赠 人 的 
风险 。 
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在 这 里 动机 因素 扮演 着 什么 角色 ? 我 们 假设 每 个 病人 有 一 个 兼容 的 供 体 集合 已 
(不 包含 自己 的 供 体 )， 并 且 可 以 向 一 个 匹配 机 制 汇报 任何 一 个 兼容 供 体 子 集 PCE, 
由 于 所 采用 的 肾脏 交换 机 制 可 以 被 任何 病人 所 拒绝 ， 因 此 一 个 可 能 的 虚报 是 病人 拒绝 
和 E, \ F; 里 的 人 进行 肾脏 交换 。 另 外 病人 也 不 能 可 靠 地 虚报 与 之 不 兼容 的 其 他 供 体 。 
我 们 假设 每 个 病人 都 有 一 个 二 值 偏 好 ， 即 在 所 有 匹配 输出 中 ， 他 偏好 于 他 被 匹配 的 
输出 。 

机 制 设计 的 目标 是 最 大 化 肾脏 移植 的 数目 。 一 个 直接 显示 的 解决 方案 如 下 所 示 。 





成 对 匹配 肾脏 交换 机 制 
1. 从 智能 体 守 收集 一 个 汇报 下 ,。 
2. 建立 图 G 一 (V， 玖 )， 其 中 V 对 应 所 有 病人 - 供 体 对 ， 边 (1，7JD) GE 已 当 且 仅 当 智 
能 体 ; 和 7 上 报 的 病人 分 别 与 智能 体 ; 和 i 上 报 的 供 体 兼容 。 
3. 返回 图 G 中 的 一 个 最 大 基数 匹配 。 











=i 





上 述 机 制 是 DSIC 的 吗 ? 是 否 真实 地 汇报 全 集 E, 对 智能 体 i 来 说 是 一 个 占 优 策 
WO? 问题 的 答案 取决 于 算法 如 何在 第 三 步 中 打破 不 同 最 大 匹配 之 间 的 平局 。 有 两 
种 情况 可 以 说 明 图 中 的 最 大 匹配 并 不 是 唯一 的 。 首 先 ， 不同 边 集 可 以 用 来 匹配 相同 
的 顶点 集 ( 见 图 10. 5)。 因 为 对 于 一 位 病人 来 说 ， 只 要 他 被 匹配 了 ,他 并 不 关心 和 
谁 匹配 ， 因 此 没有 理由 区 分 在 相同 项 点 集中 进行 的 不 同 边 的 匹配 。 更 重要 的 是 ,不 
同 的 最 大 匹配 可 能 匹配 的 不 是 同一 个 顶点 集合 。 比 如 在 图 10.6 中 ,第 一 个 顶点 在 
每 一 个 最 大 匹配 中 ， 但 是 它 只 能 和 其 他 一 个 项 点 进行 匹配 。 在 这 些 情况 下 我 们 应 该 
如 何 选择 ? 


= 
wy & 


图 10.5 不 同 匹配 可 以 匹配 相同 的 顶点 集 





O ”由 于 没有 支付 的 参与 ， 每 个 智能 体能 够 自动 地 保证 非 负 收 益 。 
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图 10.6 不 同 的 最 大 匹配 可 以 匹配 不 同 的 顶点 子 集 


一 个 解决 方案 是 在 机 制 开 始 前 就 给 所 有 的 病人 - 供 体 对 排出 一 个 优先 级 。 事 实 上 
大 多 数 医院 就 是 依靠 这 种 优先 级 模式 来 安排 病人 的 。 病 人 在 等 待 列表 中 的 优先 级 由 一 
些 因素 决定 ， 比 如 已 经 等 待 的 时 间 ， 找 到 一 个 兼容 肾脏 的 难 易 程 度 ， 等 等 。 

更 精确 地 ， 我 们 按照 如 下 方式 实施 机 制 的 第 三 步 。 假 设 G 中 的 顶点 V={1， 
2，…，? 对 按照 数字 大 小 进行 优先 级 排序 。 








成 对 肾脏 交换 中 的 优先 级 机 制 
初始 化 Mo 为 G 的 最 大 匹配 集合 
for i=l], 2, “ss ndó 
AZ 表示 匹配 集 Mi;_1 中 包含 顶点 i 的 所 有 匹配 
if Z, Æ then 
设置 M,=Z, 
else if Z, = then 
设置 M; 王 Mi-， 
返回 任意 一 个 匹配 M, 











也 就 是 说 ,在 第 i 轮 中 ， 我 们 检查 一 个 最 大 匹配 在 满足 i 之 前 所 有 智能 体 被 匹配 

的 情况 下 是 否 也 能 匹配 顶点 i。 如 果 是 的 话 ， 那 么 我 们 在 最 终 匹 配 上 把 i 加 上 。 如 果 

在 一 个 最 大 匹配 中 ，i 之 前 的 所 有 匹配 阻碍 了 i 可 能 进行 的 所 有 匹配 ， 那 么 我 们 就 跳 

过 对 i 的 匹配 ， 然 后 继续 对 下 一 个 顶点 进行 判断 。 对 i 进行 归纳 ,我们 知道 M, ÆG 

中 所 有 最 大 匹配 的 一 个 非 空子 集 。 由 于 M, 中 的 每 一 个 匹配 包含 了 相同 的 顶点 集 

合 一 一 2Z, 非 空 的 顶点 i 的 集合 ， 因 此 在 最 后 一 步 选 择 哪 一 个 匹配 是 无 关 紧要 的 。 
练习 10. 1 要 你 证 明成 对 肾脏 匹配 中 的 优先 级 机 制 是 DSIC 的 。 
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定理 10. 1( 优 先 级 机 制 是 DSIC 的 ) 在 成 对 肾脏 匹配 的 优先 级 机 制 中 ， 对 每 个 智 
能 体 i 以 及 其 他 人 的 任意 汇报 来 说 ， 不 硝 在 一 个 虚假 的 汇报 ECE, 使 得 机 制 产生 一 
个 比 真实 汇报 巨 ; 更 好 的 结果 。 


10. 1.4 医院 方 的 动机 因素 


很 多 病人 - 供 体 对 是 由 医院 而 不 是 他 们 自己 上 报到 国家 肾脏 匹配 项 目 里 的 。 一 个 
医院 的 目标 是 尽 可 能 多 地 对 自己 医院 里 的 病人 进行 匹配 ， 但 是 这 个 目标 与 整体 社会 性 
的 目标 不 相符 。 社 会 性 的 目标 要 求 在 所 有 可 能 病人 - 供 体 对 上 进行 尽 可 能 多 的 匹配 。 
医院 方 的 主要 动机 可 以 通过 下 面 的 例子 进行 很 好 的 说 明 。 

例 10. 2( 完 全 汇报 的 收益 ) 假设 有 两 家 医院 H 和 万 :， 每 一 家 医院 都 有 三 个 病 
人 - 供 体 对 (图 10.7)。 类 似 10.1.3 节 ， 图 中 的 边 连接 了 两 个 互相 兼容 的 对 。 每 一 家 
医院 都 有 一 个 可 以 在 医院 内 部 匹配 的 对 ， 这 个 匹配 其 实 没有 必要 上 报 给 国家 交换 中 
心 。 但 是 我 们 不 想 让 医院 在 内 部 进行 匹配 。 如 果 H 在 内 部 匹配 1 和 2， 然后 只 上 报 
3 给 交换 中 心 ; MH. He 在 内 部 匹配 5 和 6， 只 把 4 上 报 给 交换 中 心 ; 如 此 的 话 3 和 
4 是 不 会 得 到 匹配 的 ， 从 而 没有 了 更 多 的 匹配 。 但 是 如 果 万 | 和 H, 把 各 自 的 三 个 对 
都 上 报 给 交换 中 心 ， 那 么 1、2、3 可 以 分 别 和 4、5、6 相 匹 配 ， 这 样 所 有 的 病人 都 得 
到 了 一 个 新 的 肾脏 。 一 般 而 言 ， 机 制 的 目标 是 激励 医院 上 报 所 有 的 病人 - 供 体 对 ， 以 
RKP ZAM AG, 





图 10.7 f 10. 2 一 一 医院 方 的 完全 汇报 能 够 产生 更 多 的 匹配 


例 10. 3( 不 存在 DSIC 的 最 大 匹配 机 制 ) 考虑 只 有 两 家 医院 ， 总 共有 了 7 个 病人 
(图 10. 8) 。 假 设 交 换 中 心 总 是 根据 其 已 有 的 病人 - 供 体 信 息 计 算 一 个 最 大 基数 匹配 。 如 
果 顶 点 数 为 奇数 的 话 ， 那 么 每 一 个 匹配 都 至 少 会 剩 下 一 个 未 匹配 的 病人 。 如 果 里 | HR 
换 中 心 隐藏 病人 2 和 3， 但 是 H ARII, BAH, 能 保证 其 医院 的 所 有 病人 都 能 被 匹 
配 上 。 在 由 所 有 汇报 生成 的 图 中 ,唯一 的 最 大 匹配 包含 6 和 7( 以 及 4 和 5), MAH, 
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可 以 在 内 部 匹配 2 43, A-n., RH, 隐藏 病人 5 和 6， 但 是 H 真实 汇报 ， 那 
4H, 的 病人 都 会 被 匹配 。 在 这 种 情况 下 ， 唯 一 的 最 大 匹配 是 1 和 2 以 及 3 和 4， 但 
HH, 可 以 内 部 匹配 5 和 6。 由 此 我 们 得 出 结论 ， 不 管 交 换 中 心 选 择 哪 一 个 最 大 匹配 ， 
至 少 都 会 有 一 家 医院 存在 扣留 病人 - 供 体 对 的 动机 。 因 此 ， 社 会 性 的 目标 和 医院 的 目 
标 是 不 可 协调 的 ,不 存在 DSIC 的 机 制 使 得 我 们 总 能 得 到 一 个 社会 性 的 最 大 匹配 。 





图 10.8 {j 10. 3 一 一 医院 有 动机 隐藏 病人 - 供 体 对 


鉴于 例 10. 3 中 存在 的 问题 ， 目 前 在 一 些 针 对 医院 方 的 机 制 设计 研究 中 ， 会 考虑 
松弛 的 动机 约 东 以 及 近似 的 社会 最 优 。 


10.2 稳定 匹配 


稳定 匹配 是 不 含 钱 机 制 设计 中 的 一 个 经 典 案例 。 在 稳定 匹配 中 ， 最 具 吸 引力 的 应 用 
包括 把 医学 院 毕 业 生 分 配给 医院 ， 把 学 生 分 配给 学 校 。 接 下 来 要 介绍 的 模型 和 算法 可 以 
直接 应 用 在 这 些 场景 中 ,并 且 通 过 非常 简单 的 修改 后 也 能 用 于 一 些 其 他 的 场景 中 。 


10.2.1 模型 


考虑 两 个 大 小 相同 的 有 限 顶 点 集合 V 和 W， 比 如 申请 人 和 医院 。 每 个 顶点 对 男 
一 个 集合 中 的 顶点 都 有 一 个 排序 。 例 如 ， 在 图 10.9 中 ， 所 有 申请 人 对 医院 都 有 一 个 
相同 的 排序 ， 然 而 每 家 医院 对 申请 人 都 有 不 一 样 的 排序 。 

用 MM 表示 V 和 W 的 一 个 完美 匹配 ， 即 把 集合 中 的 每 一 个 顶点 分 配给 另外 一 个 集合 
中 的 顶点 。 如 果 满 足以 下 条 件 ， 则 称 顶 点 v€V 和 wEW 在 匹配 M 中 构成 一 个 阻塞 对 
(blocking pair): 立 和 也 在 M 中 没有 被 匹配 ， 并 且 相 比 于 各 自 匹 配 的 顶点 ，v 更 喜欢 w, 
同样 ，w 也 更 愿意 与 v 匹配 。 一 个 阻塞 对 会 带 来 一 些 麻 烦 ， 因 为 这 两 个 顶点 有 动机 脱离 
匹配 M， 然 后 私下 里 互相 匹配 。 如 果 匹 配 中 不 存在 阻塞 对 ， 那 么 我 们 称 一 个 完美 匹配 是 
稳定 的 。 
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图 10.9 —P EVECARE. ES BA A UA 
排序 一 一 最 喜欢 的 顶点 排 在 序列 中 最 项 端 


10.2.2 延迟 接受 算法 
我 们 接 下 来 讨论 能 够 输出 稳定 匹配 的 优美 算法 : 延迟 接受 算法 。 





延迟 接受 算法 
while 存在 一 个 未 匹配 的 申请 人 veV do 
v 尝试 和 ww 进行 匹配 ， 其 中 忆 是 还 未 拒绝 的 医院 中 他 最 喜欢 的 那个 
if w 还 没有 匹配 then 
把 wv 和 ww 进行 临时 性 的 匹配 
else if w 已 经 临时 性 地 和 w' 进行 匹配 then 
Ww 拒绝 名和 必 中 他 相对 不 喜欢 的 那个 ， 然 后 和 另外 一 个 进行 临时 性 匹配 
| et a mH a 








J 








例 10. 4( 延 迟 接受 算法 ) 考虑 图 10.9 中 的 例子 。 假 设 在 第 一 轮 中 算法 选择 了 申 
请 人 C，C 打算 和 他 的 第 一 选择 也 进行 匹配 。 由 于 DD 目前 还 没有 其 他 的 申请 ， 所 以 
医院 DD 接受 了 C 的 申请 。 如 果 我 们 在 下 一 轮 中 选择 申请 人 B， 此 时 BB 也 向 DD 提出 申 
请 。 因 为 刀 更 喜欢 召 ， 所 以 医院 万 拒绝 了 C 然后 和 B 进行 匹配 。 如 果 我 们 接着 挑选 
申请 人 A， 结 果 和 上 一 轮 类 似 : DD 拒绝 了 妃 ， 然 后 和 人 及 进行 匹配 。 在 接 下 来 的 算法 
中 ， 可 能 的 流程 是 : 申请 人 C 现在 向 他 的 第 二 选择 巨 发 起 申请 ; 然后 申请 人 BLP 
HE, RAEBBAT CHET B; 最 后 ，C 向 他 的 最 后 一 个 选择 正 PH., REF 


je 
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在 延迟 接受 算法 中 有 几 个 性 质 需要 我 们 注意 。 首 先 ， 每 个 申请 人 都 系统 性 地 从 上 
到 下 遍历 他 的 偏好 列表 。 第 二 ， 由 于 医院 总 是 选择 更 好 的 申请 人 ， 因 此 医院 方 在 整个 
算法 过 程 中 总 是 在 改进 与 他 进行 临时 性 匹配 的 申请 人 。 第 三 点 ， 在 算法 的 任意 时 刻 ， 
每 个 申请 人 最 多 只 匹配 了 一 家 医院 并 且 每 家 医院 也 最 多 匹配 了 一 个 申请 人 。 

稳定 匹配 和 延迟 接受 算法 有 非常 多 令 人 意外 的 结论 。 下面 是 最 基础 的 一 些 。 

定理 10. 5( 稳 定 匹 配 的 快速 求解 ) 延迟 接受 算法 在 最 多 从 轮 和 迭代 后 得 到 一 个 稳 
定 匹 配 ， 其 中 n 为 任意 一 方 的 顶点 数目 。 

推论 10. 6( 稳 定 匹 配 的 存在 性 ) ”对 任意 一 组 申请 人 和 医院 的 偏好 列表 ， 至 少 存 
在 一 个 稳定 匹配 。 

推论 10. 6 初 看 起 来 并 不 显眼 。 然 而 ， 对 于 一 些 稳定 匹配 问题 的 简单 变种 ， 可 能 
并 不 存在 稳定 匹配 。 

定理 10. 5 的 证 明 : 迭代 次 数 的 上 限 很 好 证 明 。 由 于 每 个 申请 人 从 上 到 下 遍历 他 
的 偏好 列表 ， 并 且 从 不 会 向 同一 家 医院 提出 两 次 申请 ， 因 此 对 于 每 个 申请 人 来 说 最 多 
进行 n 次 申请 尝试 ， 所 有 申请 人 的 尝试 最 多 nn 次 。 

接 下 来 我 们 断言 延迟 接受 算法 能 使 得 每 个 申请 人 匹配 到 某 个 医院 (医院 反之 亦 
然 );。 因 为 如 果 不 是 这 样 的 话 ， 那 说 明 某 个 申请 人 一 定 被 所 有 n KEKET., HF 
一 个 申请 人 只 有 当 匹 配 的 医院 接受 一 个 更 好 的 申请 人 时 才 会 被 拒绝 ， 因 此 一 旦 一 家 医 
院 已 经 匹配 了 某 个 申请 人 ， 那 么 在 接 下 来 算法 的 执行 过 程 中 ， 此 医院 肯定 仍然 匹配 到 
了 一 个 申请 人 。 因 此 ， 所 有 n 家 医院 在 算法 结束 时 都 匹配 到 了 申请 人 。 但 是 如 此 的 话 
n 个 申请 人 也 同样 在 算法 结束 时 被 医院 接受 了 ， 这 是 矛盾 的 。 

为 了 证 明 最 终 匹 配 是 稳定 的 ， 考 虑 申请 人 v 和 医院 多 未 互相 匹配 。 有 两 种 情况 
能 产生 此 场景 。 第 一 种 情况 是 ，wv 从 来 都 没有 尝试 去 申请 w。 由 于 wv 是 按 他 的 偏好 列 
表 依 次 申请 ， 因 此 v 最终 匹配 到 一 个 比 w 更 好 的 医院 。 如 果 在 算法 的 某 个 阶段 ”的 
确 申 请 了 tw， 那么 w 肯定 为 了 一 个 更 好 的 申请 人 而 拒绝 了 w( 要 么 是 在 v 尝试 申请 也 
的 时 候 ， 要 么 是 在 v 和 临时 性 匹配 后 )。 由 于 在 整个 算法 运行 过 程 中 ww 只 能 提升 他 
接受 的 申请 人 序列 ， 因 此 多 最 终 会 匹配 一 个 比 v 更 好 的 申请 人 。 m 


10.3 更 多 的 性 质 


延迟 接受 算法 里 有 一 些 模糊 的 地 方 ， 比 如 我 们 并 不 清楚 在 每 一 轮 迭 代 中 怎么 选择 
未 匹配 的 申请 人 。 是 否 任意 一 个 选择 都 能 导致 相同 的 稳定 匹配 ? 在 图 10.9 中 ， 仅 有 
一 个 稳定 匹配 ， 因 此 在 这 个 例子 中 答案 是 肯定 的 。 然 而 在 一 般 情况 下 ， 有 可 能 存在 多 
个 稳定 匹配 。 在 图 10. 10 中 ,申请 人 和 医院 对 对 方 的 排序 都 不 一 样 。 使 用 延迟 接受 算 
法 ， 两 个 申请 人 都 得 到 了 他 们 的 第 一 选择 ， 即 A、B 分 别 与 C、D 匹配。 不 过 分 配给 
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每 家 医院 他 们 最 偏好 的 申请 人 会 产生 另 一 个 不 同 的 稳定 匹配 。 
下 一 个 结果 表明 ， 延 迟 接受 算法 的 结果 与 在 每 一 轮 迭 代 中 选择 哪 一 个 未 匹配 的 申 
请 人 无 关 。 对 申请 人 v S A(z) 表 示 在 所 有 稳定 匹 


wW 
配 中 排名 最 高 的 医院 (在 v 的 偏好 列表 里 )。 č 5 
定理 10. 7( 申 请 人 最 优 性 ) hEr Q 


法 计算 得 到 的 稳定 匹配 中 ， 每 个 申请 人 VEV 匹配 


2) 7 ho). 2 (G) Q) 
定理 10.7 表明 “申请 人 最 优 ” 的 稳定 匹配 的 e 2 


存在 性 ， 在 此 类 稳定 匹配 中 每 个 申请 人 都 同时 处 。 图 10.10 可 能 存在 多 个 稳定 匹配 
于 对 他 们 最 有 利 的 场景 。 先 验 上 来 看 ， 我们 没有 
任何 理由 期 望 每 个 申请 人 的 h(v) 是 不 同 的 ， 然 后 由 此 形成 一 个 匹配 。 

定理 10.7 的 证 明 : 考虑 运行 一 次 延迟 接受 算法 ， 并 令 尺 表示 所 有 (vwv，w) 对 的 集 
合 ， 其 中 多 在 某 个 时 刻 拒绝 了 vw。 由 于 每 个 申请 人 系统 性 地 从 上 到 下 遍历 他 的 偏好 列 
表 ， 如 果 在 算法 结束 时 wv 和 ww 匹配 了 ， 那 么 对 于 任意 一 个 比 we ERK w. 我们 有 
(vy, WER, Ast. 下面 的 断言 暗含 了 此 定理 : 对 任意 (vw，w) ER， 不 存在 一 个 稳 
EIET v Aw, 

用 R; 表示 在 前 i RUE PAA Co, wet, Hp w EAEE T vs FR 
过 归纳 法 证 明 在 R; 里 的 对 不 会 出 现在 稳定 匹配 中 。 初 始 地 令 Ro 二 个 ， 结 论 显然 成 
立 。 在 归纳 阶段 ,假设 在 延迟 接受 算法 的 第 i 轮 迭 代 中 , wA T v 拒绝 了 uv。 这 意味 
Hv. v 中 的 某 个 尝试 在 本 轮 中 和 也 匹配 。 

由 于 wv' 系 统 性 地 从 上 到 下 遍历 其 偏好 列表 ， 因 此 对 每 一 个 比 w 更 优 的 w'， 我 们 
A, w) ER 1。 由 归纳 假设 可 知 ， 不 存在 稳定 匹配 使 得 v' 匹 配 到 比 w 更 好 的 医 
院 一 一 在 每 一 个 稳定 匹配 中 ,wv 与 多 或 者 比 包 更 差 的 医院 相 匹 配 。 由 于 相 比 于 v w 
更 喜欢 v' 并 且 v' 在 所 有 稳定 匹配 的 医院 中 更 喜欢 w， 因 此 不 存在 稳定 匹配 对 v 和 忆 
(否则 的 话 w ,也 形成 一 个 阻塞 对 ) 。 4 

从 医院 的 角度 来 说 ， 延 迟 接受 算法 输出 了 一 个 最 差 的 稳定 匹配 (练习 10. 6° 。 

假设 申请 人 和 医院 的 偏好 列表 都 是 私有 信息 。 那 么 通过 让 所 有 项 点 上 报 偏 好 信息 
然后 运行 延迟 接受 算法 可 以 得 到 一 个 DSIC 的 机 制 吗 ?就 像 定 理 10.7 中 隐 含 的 那样 ， 
延迟 接受 算法 在 申请 人 这 端 是 DSIC 的 而 在 医院 这 端 不 是 DSIC 的 ( 见 问题 10. 1 和 练 
.10.7); 

定理 10. 8( 激 励 性 质 ) 考虑 如 下 机 制 : 由 申请 人 和 医院 上 报 偏好 列表 信息 ， 然 
后 根据 这 些 信 息 运行 延迟 接受 算法 。 

(a) 对 任意 申请 人 wv 以 及 所 有 其 他 申请 人 和 医院 上 报 的 偏好 信息 ，v 不 可 能 得 到 


日 ”修改 算法 ， 使 得 “医院 进行 选择 ， 申 请 人 拒绝 ”会 得 到 相反 的 性 质 。 
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比 说 真 话 严格 更 好 的 结果 。 
(b) 对 医院 tw 来 说 ， 存 在 一 个 偏好 列表 和 其 他 人 的 汇报 使 得 ww 得 到 比 说 真 话 严 
格 好 的 结果 。 


o 肾脏 交换 使 得 两 个 或 者 多 个 不 兼容 的 病人 - 供 体 对 中 的 病人 从 对 方 的 供 体 那 里 
获得 一 个 肾脏 。 

e TTC 算法 可 以 应 用 在 肾脏 交换 中 并 通过 交换 供 体 来 提高 所 有 病人 的 兼容 性 。 
但 是 此 算法 会 导致 在 现实 中 不 可 行 的 超 长 交换 环 。 

o 匹配 算法 可 以 进行 成 对 的 凤 脏 交换 并 且 激 励 病 人 接受 任何 一 个 与 之 兼容 的 

供 体 。 

相 比 于 把 所 有 不 兼容 对 都 上 报 给 国家 交换 中 心 ， 医 院 方 有 动机 在 内 部 进行 不 

兼容 的 病人 - 供 体 对 的 匹配 。 

e 一 个 稳定 匹配 是 指 一 组 申请 人 和 医院 的 配对 ， 在 此 匹配 中 不 存在 申请 人 和 医 
院 对 通过 互相 匹配 使 得 双方 都 获得 更 好 的 结果 。 

o 延迟 接受 算法 会 得 到 一 个 申请 人 最 优 的 稳定 匹配 。 

o 由 延迟 接受 算法 导出 的 直接 机 制 对 申请 人 来 说 是 DSIC 的 但 是 对 医院 方 不 是 。 


说 明 


把 TTC 算法 用 于 肾脏 交换 问题 上 出 自 Roth 等 (2004)。 基 于 Abdulkadiroglu 和 
S6nmez(1999) 的 学 生 宿舍 分 配 问题 ，Roth 等 (2004) 还 把 TTC 算法 以 及 附带 的 激励 
保证 性 质 扩展 到 了 存在 遗体 捐赠 人 (没有 房 主 的 房屋 ) 和 无 活体 捐赠 人 的 病人 (没有 房 
屋 的 个 体 ) 的 匹配 问题 上 。 应 用 匹配 算法 实现 成 对 的 肾脏 匹配 来 自 Roth 等 (2005 ) 。 
Roth 等 (2007) 考 虑 了 三 路 肾脏 交换 问题 ， 即 同时 对 三 个 病人 和 三 个 供 体 进行 手术 。 
三 路 交换 可 以 极 大 地 增加 病人 匹配 的 数量 ， 也 正 是 由 于 这 一 点 三 路 交换 目前 变 得 很 普 
遍 。 采 用 四 路 或 者 更 大 的 交换 似乎 并 不 能 获得 更 大 程度 上 的 匹配 数目 的 提升 。Sack 
(2012) 描 述 了 一 个 长 达 30 个 肾脏 移植 的 链 ， 此 链 由 一 个 利他 性 的 活体 捐赠 人 起 始 。 
对 于 医院 方 动机 问题 的 研究 来 自 于 Ashlagi 等 (2015) 。 

Gale 和 Shapley(1962) 正 式 定义 了 稳定 匹配 问题 ， 文 章 中 给 出 了 延迟 接受 算法 并 
证 明了 定理 10.5 和 10.7。 我 们 这 里 讨论 的 此 算法 变种 (未 匹配 的 申请 人 通过 依次 而 
不 是 同时 尝试 进行 新 一 轮 的 匹配 ?来 自 Dubins 和 Freedman(1981)。 意 外 的 是 ， 后 来 
才 发 现 本 质 上 相同 的 算法 已 经 在 1950 年 左右 被 使 用 了 ， 当 时 用 在 分 配 住院 医师 给 医 
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院 的 问题 上 (Roth，1984)S。 定 理 10.8 H Á Dubins 和 Freedman(1981) LA & Roth 
(1982a), McVitie 和 Wilson(1971) 观 察 到 了 练习 10.6, Gale 和 Sotomayor( 1985) if 
论 了 问题 10. 2, 


练习 


练习 10. 
练习 10. 


练习 10. 
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问题 


问题 10. 
问题 10. 


N — 


Sk 


(H) 证 明和 定理 10. 1 。 

给 出 一 种 在 多 个 最 大 匹配 中 打破 平局 的 方法 ， 在 此 方法 下 相应 的 成 对 肾 

脏 匹 配 机 制 不 是 DSIC 的 。 

扩展 例 10. 3 的 结果 ， 并 说 明 不 存在 一 个 DSIC 的 匹配 机 制 ， 其 总 能 得 到 

超过 最 大 匹配 一 半数 量 的 病人 - 供 体 对 。 

证 明 存 在 一 个 常数 < 之 0， 使 得 对 于 任意 大 的 2， 延迟 接受 算法 需要 至 少 

cn” 轮 才 能 结束 。 

假设 每 个 申请 人 和 医院 都 有 一 个 关于 对 方 所 有 节点 的 总 排序 以 及 一 个 

“外 部 选项 ”。 换 名 话说， 每 个 顶点 相 比 于 某 些 可 能 的 匹配 而 言 更 偏好 于 

选择 不 匹配 。 

(a) 扩展 稳定 匹配 的 定义 ,使 其 融合 外 部 选项 。 

(b) 扩展 延迟 接受 算法 和 定理 10. 5 使 其 能 够 在 存在 外 部 选项 的 情况 下 计 
算出 一 个 稳定 匹配 。 

DIER w, S zw) 表 示 双 在 所 有 稳定 匹配 中 排名 最 低 的 申请 人 (在 w 

的 偏好 列表 中 )。 证 明 延 迟 接受 算法 得 到 的 稳定 匹配 中 ， 每 家 医院 WE W 

都 匹配 到 了 Cw). 

给 出 一 个 证 明定 理 10. 8b 的 例子 。 


CH) 证 明和 定理 10. 8a。 

考虑 在 延迟 接受 算法 中 的 医院 方 。 给 定 两 个 偏好 列表 ， 如 果 对 于 某 个 医院 来 
说 前 者 总 能 产生 一 个 至 少 和 后 者 一 样 好 的 结果 (固定 其 他 申请 人 和 医院 上 报 的 
信息 )， 并且 在 至 少 一 个 例子 上 ， 前 者 得 到 的 结果 严格 优 于 后 者 得 到 的 结果 ， 
那么 我 们 称 第 一 个 偏好 列表 是 严格 优 于 另外 一 个 的 。 证 明 对 任意 一 家 医院 来 
说 ， 真 实地 报告 自己 最 偏好 的 申请 人 要 严格 优 于 虚报 最 偏好 的 申请 人 。 





原始 的 延迟 接受 算法 是 医院 最 优 性 版 本 ， 但 是 后 来 在 20 世纪 90 年 代 改 为 了 偏向 申请 人 的 版 本 (Roth 


and Peranson, 1999). 
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自私 路 由 与 无 秩序 代价 


本 章 开始 介绍 本 书 的 第 二 部 分 。 在 许多 场合 下 ， 我 们 没有 办 法 从 无 到 有 地 设计 一 
个 博弈 。 因 为 和 所 有 精心 设计 的 DSIC 机 制 不 同 ， 现 实 中 的 博弈 大 部 分 没有 占 优 策 
略 。 为 了 预测 这 种 博弈 的 结果 ， 就 需要 引入 “均衡 ”的 概念 。 由 于 参与 者 都 采取 自 利 
的 行为 ， 我 们 没有 理由 认为 均衡 一 定 是 符合 社会 期 望 的。 但 令 人 高 兴 的 是 ， 在 相对 较 
弱 的 假设 下 ， 许 多 模型 中 的 均衡 其 实 是 近似 最 优 的 。 本 章 及 下 一 章 就 会 研究 这 样 一 个 
经 典 模型 一 一 “自私 路 由 ”博弈 。 

11.1 节 用 三 个 例子 简单 介绍 自私 路 由 。11.2 节 和 11. 3 节 阅 述 并 解释 本 章 的 主要 
结论 : 对 于 极其 简单 的 网 络 ， 它 的 无 秩序 代价 总 是 最 大 的 ; 同时 ， 如 果 代 价 函 数 具 有 
不 太 高 的 非 线 性 ， 那 么 自私 路 由 所 产生 的 均衡 就 是 近似 最 优 的 。11. 4 节 正 式 定义 了 
均衡 流 并 解释 了 均衡 流 的 特性 ，11. 5 节 证 明了 本 章 的 主要 结论 。 


11.1 自私 路 由 


在 正式 定义 自私 路 由 模型 之 前 ， 我 们 先 通 过 一 系列 例子 建立 一 些 直观 认识 ， 并 由 
此 引出 本 章 的 主要 结论 。 


11.1.1 布雷 斯 悖 论 


在 第 1 章 中 我 们 介绍 过 布雷 斯 悖 论 (1.2 节 )。 回 顾 一 下 ， 一 个 单位 的 交通 流 ， 比 
如 一 群 高 峰 期 的 司机 ， 从 起 点 o 出 发 前 往 终点 d。 在 图 11. 1a 中 的 网 络 中 ， 根 据 对 称 
性 ， 均 衡 情 况 下 每 条 路 线 都 承载 一 半 的 交通 流 ， 且 每 一 个 司机 花费 的 时 间 是 3/2。 现 
在 假设 安装 一 个 瞬间 传送 通道 ， 使 得 司机 可 以 从 wv 立刻 移动 到 ww( 如 图 11.1b)， 此 
时 ， 选 择 新 的 路 线 ove wed 对 每 个 司机 来 说 就 是 一 个 占 优 策略 。 这 个 新 均衡 下 每 
个 人 花费 的 时 间 是 2。 而 可 能 的 最 短 时 间 是 3/2， 所 以 使 用 瞬间 传送 通道 没有 任何 好 
处 。 这 个 自私 路 由 网 络 的 无 秩序 代价 (Price Of Anarchy，POA) 定 义 为 : 均衡 情况 下 
所 用 的 时 间 与 最 小 的 平均 时 间 的 比值 ， 即 2/ (3/2) =4/3,° 





O 这样 定义 是 有 道理 的 ， 因 为 本 章 考虑 的 自私 路 由 网 络 总 是 至 少 存在 一 个 均衡 ， 而 且 每 个 均衡 的 平均 
花费 时 间 都 是 一 样 的 ( 见 第 13 章 )。 第 12 章 会 将 POA 的 定义 扩展 到 具有 多 个 均衡 的 博弈 中 。 








a) 初始 网 络 b ) 改进 网 络 
图 11.1 再 谈 布雷 斯 悖 论 。 边 上 的 值 代表 这 条 边 的 代价 函数 ， 即 通过 某 条 边 所 用 的 时 间 定 义 为 使 
用 这 条 边 的 流量 x 的 函数 。 在 图 b 中 ， 无 秩序 代价 为 4/3 


11. 1.2 Pigou 示例 


11. 2a 中 的 Pigou 示例 是 一 个 更 加 简单 的 自私 路 由 网 络 ， 它 的 POA 是 4/3。 在 
这 个 网 络 中 ， 即 使 所 有 的 流量 都 走 下 面 的 一 条 边 ， 代 价 也 不 会 比 其 他 的 情况 高 。 因 
此 ， 选 择 下 面 的 边 对 每 个 司机 来 说 都 是 占 优 策略 ， 均 衡 情况 下 所 有 司机 都 会 选择 这 条 
边 且 时 间 代 价 为 1。 假如 存在 一 个 利他 的 管理 员 ， 他 可 以 将 交通 流 均 摊 到 两 条 边 上 来 
减少 平均 时 间 代 价 。 这 样 ,平均 时 间 代 价 变 为 3/4。 所 以 ，Pigou 示例 中 POA 为 
1/(3/4) =4/3, 


“=1 ow] 


c(x)=x e(x)=x” 
a) Pigou 示 例 b ) Pigou 示 例 的 一 种 非 线性 情况 
图 11.2 Pigou 示 例 及 其 非 线性 变种 


11.1.3 Pigou 示例 : 非 线 性 变种 


在 布雷 斯 悖 论 和 Pigou 示例 中 POA 都 是 4/3， 这 还 算 可 以 接受 。 然 而 ， 对 于 任意 的 
网 络 来 说 ， 情 况 就 不 那么 乐观 了 。 在 Pigou 示例 的 非 线性 变种 下 (图 11.2b)， 即 下 面 的 
边 的 代价 函数 是 cl) =2" 而 不 是 c(z) 二 x 且 其 中 pp 很 大 时 ， 选择 下 面 的 边 仍 是 占 优 策 
略 ， 达 到 均衡 时 司机 花费 的 时 间 也 仍然 是 1。 但 现在 最 优 解 就 好 得 多 了 ， 如 果 交 通 流 再 
次 被 均 挫 到 两 条 边 上 ， WAM p 一 oO 时 ,司机 的 时 间 代 价 趋 于 1/2， 因 为 此 时 在 下 面 的 
边 上 的 司机 几乎 可 以 瞬间 到 达 4。 更 好 的 方法 是 分 配 1 一 s 的 交通 流 到 下 面 的 边 ， 其 中 p 
趋 于 无 穷 ，e 趋 于 0。 这样， 几乎 所 有 的 交通 流 消耗 的 时 间 都 是 (1 一 e)*， 当 p 足够 大 时 ， 
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(1 一 e)* 接近 于 0， 而 在 上 面 那 条 边 es 个 单位 的 “牺牲 者 ”对 平均 时 间 代 价 影响 很 小 。 所 
以 可 以 归纳 出 : 当 >ce 时 ， 非 线性 Pigou 示例 的 POA 无 界 。 


11.2 主要 结论 : 非 正 式 的 表述 


自私 路 由 的 POA 可 大 (11.1.3 节 ) 可 小 (11.1.1 节 和 11.1.2 节 )。 本 章 的 目标 就 
是 要 深入 了 解 : 什么 情况 下 自私 路 由 的 POA 能 接近 1。 回 顾 我 们 提 到 的 三 个 例子 ， 
可 以 发 现 ， 具有 “很 高 的 非 线 性 ”的 代价 函数 ?会 阻碍 自私 路 由 网 络 的 POA 接近 l, 
而 两 个 线性 代价 函数 的 例子 中 ，POA 就 比较 小 。 基 于 这 些 观察 ， 我们 抛 出 一 个 猜想 : 
代价 函数 的 高 非 线性 是 实现 较 小 POA 的 唯一 障碍 。 即 对 于 任意 复杂 的 路 由 网 络 ， 如 
果 其 代价 函数 的 非 线 性 不 高 ， 则 它 的 POA 都 接近 1。 本 章 将 规范 化 的 描述 并 证 明 这 
个 猜想 。 

考虑 如 下 模型 : AWR GSV., E). MARV, 边 集 为 下， 起 点 为 o， 终 点 为 
d。r 个 单位 的 交通 ( 流 ) 从 0。 流向 4 。 我 们 将 G 看 成 经 典 最 大 /最 小 费用 流 问 题 ， 网 
络 中 的 每 条 边 。 都 有 一 个 时 间 代 价 函 数 ， 将 (单位 交通 流 的 ) 时 间 代 价 视 作 交通 流 的 函 
数 。 边 的 容量 不 限定 。 在 这 一 章 和 下 一 章 中 ,我 们 总 是 假设 代价 函数 非 负 、 连 续 且 非 
递减 。 在 大 多 数 现实 应 用 中 ， 比 如 道路 或 者 通信 和 网络 中 ， 这 些 都 是 理所当然 的 假设 。 

我 们 首先 给 出 主要 结论 的 一 个 非 正式 版 本 ， 然 后 展示 如 何 理解 和 使 用 。 在 11. 3 
节 我 们 会 给 出 正式 版 本 ,在 11.4 和 11.5 节 给 出 证 明 。 值 得 注意 的 是 ， 这 个 定理 的 参 
数 是 代价 函数 的 集合 C。 这 表明 在 直觉 上 ， 自 私 路 由 的 POA 看 起 来 的 确 和 代价 函数 
的 “ 非 线性 程度 ”有 关 。 即 使 对 于 简单 的 代价 函数 集合 C， 比 如 仿 射 函 数 集合 {c(z) 三 
az 十 0: a, b20}, XPS WRA BB. 

定理 11. 1( 自 私 路 由 的 严格 POA 界 ) 在 所 有 代价 函数 集合 为 C 的 网 络 中 ， 和 
Pigou 示例 类 似 的 网 络 的 POA RK, 

11. 3 节 中 会 对 术语 “和 Pigou 示例 类 似 的 网 络 ” 进 行 精确 描述 。 定 理 11. 1 的 要 
点 是 : 最 坏 情况 的 例子 总 是 很 简单 的 那些 。 造 成 自私 路 由 效率 很 低 的 主要 原因 是 代价 
函数 的 非 线性 ， 而 不 是 复杂 的 网 络 结构 。 

对 革 些 特殊 代价 函数 集合 C， 定 理 11. 1 可 以 将 计算 最 差 POA 的 问题 归 约 成 很 简 
单 的 问题 。 而 如 果 没 有 定理 11. 1 的 话 ， 我 们 就 只 能 设法 在 所 有 代价 函数 为 C 的 网 络 
中 进行 搜索 ， 然 后 找 出 POA 最 大 的 那个 。 定 理 11. 1 保证 了 我 们 只 需要 在 类 似 Pigou 
示例 的 简单 网 络 中 进行 搜索 就 可 以 了 。 





名 ”原文 为 “highly nonlinear” cost function。 可 以 理解 为 代价 为 多 项 式 函 数 ， 且 阶 次 很 高 。 一 一 译 者 注 
加 “为 实现 符号 最 少 化 ,我 们 仅 在 “ 单 物 品 网 络 ” 阐 述 并 证 明 主 要 结论 ， 即 网 络 中 只 有 一 个 起 点 和 终点 。 
主要 结论 及 甚 证明 可 以 扩展 到 多 起 点 和 多 终点 的 情况 (练习 11. 5)， 
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举 个 例子 ， 当 C 是 系数 非 负 的 仿 射 代价 函数 集 时 ， 定 理 11.1 表明 ，Pigou 示例 
(11.1.2 节 ) 的 POA 最 大 。 即 这 种 情况 下 自私 路 由 网 络 的 POA 总 是 至 多 为 4/3。 当 C 
是 系数 非 负 的 多 项 式 代 价 函 数 集 ， 且 多 项 式 的 次 数 至 多 为 p 时 ， 定理 11. 1 表明， 最 
坏 的 情况 不 过 就 是 Pigou 示例 的 非 线 性 情况 (11.1.3 节 )。 算 出 这 个 最 坏 情况 下 的 
POA， 就 可 以 得 到 与 之 类 似 的 所 有 自私 路 由 网 络 的 POA 上 界 。 表 11.1 列 出 了 一 些 
例子 ， 这 些 例子 表明 ， 只 有 在 代价 函数 为 “高 非 线 性 ”的 网 络 中 ， 自 私 路 由 的 POA 
才 会 很 大 。 比 如 ， 对 于 道路 交通 网 络 ， 四 次 函数 是 一 个 合理 的 模型 。 而 在 代价 函数 为 
四 次 函数 的 网 络 中 ， 最 坏 情 况 下 POA 比 2 稍 大 。 在 第 12 章 我 们 会 继续 讨论 通信 网 络 
中 代价 函数 的 情况 。 


























表 11.1 如 果 自 私 路 由 网 络 代价 函数 为 系数 非 负 的 多 项 式 函 数 ， 且 阶 数 最 高 为 p， 
其 最 坏 情 况 下 的 POA 如 下 所 示 
表达 式 典型 示例 无 秩序 代价 
线性 函数 ax +b 4/3 
一 2 3V3 = 
二 次 函数 ar? +br+e 了 1.6 
三 次 函数 ax’ + br? +cr +d > tH x1. 
四 次 函数 ax’ 二 2 ~ 2.2 
Ps aa pH) Yprl _ p 

ni 2a (p+1) Ypri—p inp 








11.3 主要 结论 : 正式 的 表述 


为 了 正式 表示 定理 11. 1， 我 们 首先 需要 定义 “类 Pigou 网 络 ” 的 代价 函数 集合 
C， 再 用 对 这 些 简 单 例 子 POA 的 下 界 进行 公式 化 。 定 理 11.2 表示 了 自私 路 由 网 络 
POA 的 上 界 ， 其 中 网 络 的 代价 函数 集合 为 Co 








类 似 Pigou 网 络 的 组 成 成 分 
， HAMA ofp. 
.从 o 到 p 的 两 条 边 ， 一 条 边 在 上 面 ， 一 条 边 在 下 面 。 
. 非 负 的 交通 流 率 ~。 
. 下 面 那 条 边 的 代价 函数 c). 
. 上 面 那 条 边 的 代价 函数 处 处 相等 且 为 c(7) 。 


n e W% N e 








有 具体 可 参看 图 11. 3。 在 类 Pigou 网 络 的 表达 式 中 ， 有 两 个 自由 参数 ， 交 通 流 率 r 
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和 下 面 那 条 边 的 代价 函数 c(，)。 

类 Pigou 网 络 的 POA 很 容易 计算 。 下 面 那 条 边 
对 所 有 个 体 都 是 占 优 策略 一 一 即 所 有 交通 流 都 选择 
下 面 那 条 边 时 ， 花 费时 间 也 不 比 走 上 面 差 (花费 时 间 (o) (a ) 
恒 为 c(r))。 因 此 ， 均 衡 下 所 有 交通 流 都 会 选择 下 面 
ABA. ERY UT Ar e c(r)， 即 交通 流 的 数量 c(*) 
乘 以 所 有 交通 流 都 选择 下 面 那 条 边 时 的 单位 时 间 代 图 11.3 一 个 类 Pigou 网 络 
价 。 这 样 总 的 最 少时 间 代 价 就 可 以 写成 

inf {x e clr) + (rz) *c(r)} CALD 

其 中 工 为 通过 下 面 那 条 边 的 交通 流量 。 为 了 后 面 讨论 方便 ， 我 们 允许 zx 为 负 实数 ， 而 
不 仅仅 为 L0， 门 之 间 的 数 。 因 为 代价 函数 非 减 ， 这 个 工 定义 域 的 扩大 不 会 改变 
式 (11.1)。 由 此 可 以 总 结 出 : 在 类 Pigou 的 网 络 中 ， 当 交通 流 率 ”全 0， 下 面 那 条 边 的 代 
价 函 数 为 c(*) 时 ，POA 为 


e(r) 





| rec) 
sup (= 


a0 a Cle) =F Cr — = 
令 C 表 示 任 意 非 负 、 连 续 且 非 减 的 代价 函数 集合 。Pigou 界 可 以 定义 为 类 Pigou 
网 络 中 下 边 代 价 函 数 属于 C 的 情况 下 的 最 大 POA。 正 式 定义 为 


ar sii) ere i e a 
so = wee ae sup {> e cla) + Gr—Zz) © acy aia 


在 类 Pigou 网 络 中 ， 前 两 个 sup 是 对 自由 参数 cEC 和 r>0 进行 遍历 ， 第 三 个 sup W 
是 对 给 定 的 类 Pigou 网 络 搜索 最 好 的 可 能 结果 。° 

对 于 其 他 集合 C， 明 确 的 Pigou 界 也 是 可 以 计算 的 。 比 如 ， 如 果 C 是 非 负 且 非 减 
的 仿 射 函数 集合 (甚至 是 止 函 数 ) ,那么 a(C)=4/3( RAY 11.1 和 11.2)。 如 果 C 是 
系数 非 负 且 次 数 有 限 的 多 项 式 函 数 集合 ，Pigou 界 的 精确 表达 式 可 以 参考 表 11. 1( 见 
练习 11.3)。 这 些 代 价 函 数 集 的 Pigou 界 都 可 以 利用 非 线性 Pigou 的 分 析 得 到 ( 见 
和 

如 果 假 定 集 合 C 包含 所 有 的 常 函 数 ， 那 么 在 类 Pigou 网 络 中 ,定义 wx(C) 就 只 需要 
使 用 C 中 的 函数 。 且 对 于 代价 函数 属于 C 的 自私 路 由 网 络 ，a(C) 就 是 自私 路 由 网 络 
POA 最 坏 情况 的 下 界 。S 

定理 11. 1 的 正式 表述 就 是 : 对 于 所 有 代价 函数 属于 C 的 自私 路 由 网 络 ， 无 论 它 
是 不 是 类 Pigou 网 络 ，wue(C) 都 是 其 POA WER. 





代价 函数 ec 的 连续 性 意味 着 这 个 下 确 界 是 可 以 达到 的 ， 不 过 我 们 并 不 需要 用 到 这 一 点 。 

如 果 比 值 为 0/0， 我 们 视 其 为 1。 

只 要 C 至 少 包 含 一 个 函数 c,， 且 c(0) 二 0， 那 么 Pigou 界 就 是 自私 路 由 网 络 POA 的 下 界 ， 其 中 自私 路 
由 网 络 的 代价 函数 属于 C。 原 因 是 ， 在 这 个 弱 假 设 下 ， 类 Pigou 网 络 可 以 被 一 个 稍微 复杂 一 点 的 网 络 
模拟 ， 而 这 个 稍微 复杂 一 点 的 网 络 的 代价 函数 只 属于 C( 见 练习 11. 4) 。 


也 四 由 
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定理 11. 2( 自私 路 由 的 严格 POAR) 对 于 所 有 代价 函数 的 集合 C 及 代价 函数 属 
于 C 的 自私 路 由 网 络 ， 其 POA 至 多 是 w(C) 。 


11.4 技术 准备 


在 证 明定 理 11. 2 之 前 ， 我 们 先 复 习 一 些 分 流 网 络 的 知识 。 分 流 和 均衡 的 概念 在 
类 Pigou 示例 网 络 中 很 好 定义 ， 但 是 在 一 般 的 网 络 中 定义 它们 就 需要 注意 。 

G 二 (V，E) 为 自私 路 由 网 络 ， 其 中 7 个 单位 的 交通 流 从 0o 转移 到 &。 令 PRR G 
中 o-d 的 路 径 集合 ， 假 定 刀 非 空 。 分 流 表示 交 通 流 是 如 何 被 分 配 到 不 同 的 o-d 路 径 上 
的 ， 它 是 一 个 非 负 的 向 量 {7z jzez 且 Di fo 一 +。 比如 ,图 11.4 中， 一 半 的 交通 流 先 


择 “ 之 字形 ”路 径 o>v>w>d， 男 一 半 则 被 平均 分 配 到 两 条 “两 跳 ” 的 路 径 上 。 


25% 





25% 


图 11.4 分 流 的 示例 ,各 有 25% 的 交通 流 分 别 选 择 路 径 oud 和 o 一 wd， 剩 
下 的 50% 选 择 路 径 ov wd 


对 于 边 eEE MARS. RNS = DS) fe 表示 选择 的 路 径 中 包含 e 的 交通 流 


量 。 比 如 ， ILAR, fom = few —3/4, fon = = l/h fever =1/2. 

在 均衡 分 流下 ， 交 通 流 只 会 选择 那些 最 短 的 o-d 路 径 ， 其 中 “最 短 ” 是 根据 交通 
流花 费 的 时 间 定义 的 。 

定义 11. 3( 均 衡 流 ) ”对 于 一 个 分 流 f， 如 果 只 有 当 

Pe argmin| Deso] 

时 才 有 fp>0, AAR f 为 均衡 分 流 。 

比如 ， 车 代价 函数 和 布雷 斯 悖 论 ( 图 11. 1b) 中 的 设置 相同 ， 那 么 图 11. 4 的 分 流 
就 不 是 均衡 流 ， 因 为 唯一 的 最 短路 径 就 是 “之 字形 ”路 径 , 但 却 有 一 些 交 通 流 没 
走 它 。 

现在 我 们 用 C( 有 ) 表 示 目 标 函 数 一 一 分 流 f 下 所 有 交通 流花 费 的 总 时 间 。 有 了 时候 
我 们 也 会 把 花费 的 总 时 间 称 为 分 流 的 代价 。 目 标 函 数 的 计算 方法 有 两 种 ， 两 种 都 很 有 
效 。 对 于 第 一 种 方法 ， 我 们 定义 
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of) = 人 
为 一 条 路 径 上 花费 的 时 间 。 然 后 ， 按 照 路 径 加 和 来 计算 花费 的 总 时 间 : 


C= >) fe sor (11. 3) 
PEP 
第 二 种 方法 是 按照 边 加 和 来 计算 花费 的 总 时 间 : 
Oty Df a (11. 4) 
e€EE 


回忆 /. 二” SD) fos 简单 交 换 一 下 求 和 顺序 就 可 以 验证 (11. 3) 式 和 (11. 4) 式 等 价 。 
F 


E Pree P 


“11.5 定理 11. 2 的 证 明 


现在 我 们 证 明定 理 11. 2。 假 定 一 个 自私 路 由 网 络 G 二 (V，E)， 其 代价 函数 属于 
C， 交 通 流 率 为 r。 令 SAF 分别 表示 网 络 中 的 均衡 分 流 和 最 小 代价 分 流 。 证 明 过 程 
分 为 两 个 部 分 。 

第 一 部 分 要 证 明 : 在 每 条 边 e 的 代价 固定 为 均衡 情况 下 的 值 c.( 广 ) 时 ， 均 衡 分 流 
三 就 是 最 优 的 ” 。 这 是 因为 在 均衡 分 流下 ， 所 有 的 交通 流 都 会 选择 最 短 的 路 径 。 

因为 f 是 均衡 分 流 ， 所 以 如 果 记过 0， 则 对 于 任意 PEP. MA cal f)<cp(f) 
( 见 定义 11. 3)。 均 衡 分 流 中 的 所 有 路 径 记 代价 都 同 为 cs(f)， 我 们 将 其 记 作 工 ， 则 对 
FHAR PEP, A ce NZL., Wik 


X fee off reek (11.5) 
Pep = ee 
和 Hr 如 果 了 PP 二 0 就 等 于 上 
而 
>) fe vw) rL (11. 6) 
Pep ~ 
fu tr >L 


利用 cp(f) = SNe.C fe) ， 再 像 式 (11.3) 和 式 (11.4) 一 样 交换 一 下 求 和 顺序 ， 就 
可 以 将 式 (11.5) 和 式 (11. 6) 左 半边 写成 按 边 求 和 的 形式 : 


了 (11.7) 
"EE 

和 
DRN «ahs rE (11.8) 
"EE 

再 用 式 (11. 8) 减 去 式 (11.7) 得 到 : 
SM — foe) >0 (11.9) 
rEE 


O 即 总 代价 最 小 化 。 一 一 译 者 注 
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不 等 式 (11.9) 直 观 地 展示 出 : 因为 均衡 分 流下 所 有 交通 流 都 选择 最 短路 径 ， 所 以 在 固 
定 边 的 代价 集合 为 {c,(f.)}.es 的 情况 下 ,任何 其 他 分 流 f* 都 不 会 更 好 。 

第 二 部 分 将 量化 说 明 最 优 分 流 广 比 均衡 分 流 f 好 多 少 。 大 概 的 思路 是 证 明 : 在 
均衡 分 流 f 和 最 优 分 流 f/" 下 ， 每 条 边 上 的 时 间 代 价 之 差 都 不 超过 Pigou 界 。 虽 然 这 
一 点 只 对 每 条 边 上 的 差 值 成 立 ， 但 是 利用 不 等 式 (11.9)， 我 们 可 以 控制 总 的 差 值 。 

对 于 每 条 边 eEE， 用 c, Bite, Er, fo Bhar, 将 Pigou FRA. DA 
半边 重 写 。 因 为 a(0) 是 遍历 所 有 c r, x 的 可 能 选择 后 得 到 的 最 小 上 界 ， 所 以 我 
们 有 

| 
hd oF i de. (fd 
Pigou 界 的 定义 在 <f Mf Sf. WOLF BIA. Pr eA te TE sk a te F 
顺序 : 





fe ferz 7 
对 所 有 边 eEE， ht 10) 两 边 进行 求 和 得 到 : 


本 7 tA 
Cy E -5 C+ OK FAF > a 


a fe ehh rife = fk fe) (11. 10) 








根据 式 (11. 9) ATS FO 


因此 POA——C(f)/C( f* ) 至 多 为 a(C)， 定理 11. 2 证 明 完 成 。 


总 结 


o 在 自私 路 由 网 络 的 均衡 分 流下 ， 所 有 的 交通 流 都 会 选择 从 起 点 到 终点 的 最 短 
路 径 。 

© 自私 路 由 网 络 的 无 秩序 代价 (POA) 是 : 均衡 分 流下 的 总 时 间 代 价 与 最 少 总 时 
间 代 价 之 间 的 比值 。 

o 布雷 斯 悖 论 和 Pigou 示例 的 POA 都 是 4/3， 而 非 线 性 Pigou 的 POA 无界。 

e 只 有 当 自 私 路 由 网 络 的 代价 函数 是 “高 非 线性 ”时 ， 网 络 的 POA 才 会 很 大 。 

© 在 只 有 两 个 顶点 和 两 条 边 的 网 络 中 ， 如 果 一 条 边 的 代价 函数 属于 集合 C， 另 一 
条 边 的 代价 是 常 函 数 ， 则 最 大 的 POA 就 是 C 集 合 下 的 Pigou 界 。 

o 对 于 所 有 代价 函数 属于 C 的 自私 路 由 网 络 来 说 ，POA 的 上 界 就 是 C 的 
Pigou 界 。 


说 明 


更 多 关于 分 流 网 络 的 背景 知识 可 以 参考 Cook 等 (1998)。Pigou 示例 由 Pigou 
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(1920) 定 义 描述 。 自 私 路 由 网 络 由 Wardrop(1952) 和 Bechmann 4 (1956) 提出 并 研 
究 。 布 雷 斯 悖 论 由 Braess (1968) 提 出 。 自 私 路 由 的 无 秩序 代价 由 Roughgarden 和 
Tardos(2002) 首 先 考虑 ， 并 且 他 们 证 明了 : 对 于 所 有 代价 函数 为 仿 射 函数 的 (多 物品 ) 
网 络 来 说 ，POA 至 多 为 4/3。 定 理 11.2 来 自 Roughgarden (2003) 和 Correa 等 
(2004)。Sheffi(1985) 论 述 了 在 建立 道路 交通 模型 时 ， 多 项 式 代价 函数 的 用 处 。 问 题 
11.3 来自 Roughgarden(2006)。 更 多 关于 自私 路 由 无 秩序 代价 的 资料 可 参考 Rough- 
garden(2005 ) 。 


练习 


练习 11.1 (H) 证 明 如 果 C 是 类 似 c(z)=caz 十 0 形式 的 代价 函数 集合 ， 且 a, b0, 
则 Pigou 界 a(C) E 4/3, 

练习 11.2 (H) 证 明 如 果 C 是非 负 连续 且 非 递减 的 止 函 数 集合 ， 则 a(C)=4/3., 

练习 11.3 对 于 正 整 数 p. OC, 表示 系数 非 负 且 次 数 至 多 为 p 的 多 项 式 集合 ， 


=| Surana, 
(a) 证 明 单 元 素 集 合 {x*} 的 Pigou 界 随 着 p 的 增 大 而 增 大 。 
(b) HEME A (ar: a20, iE {1，2，…，p)) 的 POA 界 和 集合 {x*} 的 
POA 界 相同 。 
(Cc) (HH) 证 明 C, 的 Pigou RAMES (x) H POA 界 相同 。 
练习 11.4 邻 C 为 非 负 连续 且 非 递减 的 代价 函数 集合 。 
(a)( 理 ) 证 明 如 果 C 包 含 函 数 c， 且 对 于 8>>0，c(0) 王 8B， 则 存在 自私 路 由 
网 络 ， 其 代价 函数 属于 C POA 无 限 接 近 Pigou 界 a(C)。 
(b) (HEH mE CHEK c, H c(0) 二 0， 则 存在 自私 路 由 网 络 ， 其 
代价 函数 属于 C POA 无 限 接 近 Pigou 界 w(C) 。 
练习 11.5 考虑 多 物品 网 络 G 二 (V，E)， 对 于 i 二 1，2，…，k， ;个 单位 的 交通 流 
从 起 点 o;EV 流向 终点 d; EV。 
(a) 将 分 流 和 均衡 分 流 的 定义 (定义 11.3) 扩 展 到 多 物品 网 络 中 。 
b) 将 表达 式 (11. 3) 和 式 (11.4) 扩 展 到 多 物品 的 总 时 间 代 价 上 。 
(c) 证 明 在 多 物品 网 络 中 定理 11. 2 依然 成 立 。 


问题 


问题 11. 1 Æ Pigou 示例 (11.1.2 节 ) 中 ,最 优 分 流 中 某 些 交通 流 在 其 他 路 径 上 的 代 
价 是 在 最 短路 径 上 的 两 倍 。 证 明 ， 在 每 个 代价 函数 为 仿 射 函数 的 自私 路 
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问题 11. 2 


问题 11. 3 
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由 网 络 中 ， 最 优 分 流 广 所 在 路 径 上 的 代价 至 多 是 最 短路 径 ( 由 广 所 导致 
的 时 间 决 定 的 ) 上 的 两 倍 。 

在 本 问题 中 ， 我 们 考虑 另外 一 个 目标 函数 ， 需 要 将 分 流 f 的 最 大 时 间 
代价 


pmax Dice f) 

进行 最 小 化 。 根 据 这 个 目标 函数 ， 无 秩序 代价 就 定义 为 均衡 分 流 的 最 大 

时 间 代 价 与 某 个 特殊 分 流 的 最 大 时 间 代 价 的 比值 ， 这 个 特殊 分 流 的 最 大 

时 间 代 价 是 所 有 可 能 情况 中 最 小 的 .3 

在 这 个 问题 中 ， 我 们 假设 只 有 一 个 起 点 ， 一 个 终点 ， 一 个 单位 的 交通 流 ， 

且 代 价 函 数 为 仿 射 函数 (形式 为 c (a =aart+bh., Ha. 6.20). 

(a) 证 明 在 只 有 两 个 顶点 o。 和 以 ， 但 有 任意 条 平行 边 的 网 络 中 ， 最 大 代价 
目标 函数 的 POA Æ 1. 

(b) (HD) 证 明 最 大 代价 目标 函数 的 POA 可 以 是 4/3。 

(c)《HH) 证 明 最 大 代价 目标 函数 的 POA 不 可 能 大 于 4/3. 

本 问题 研究 的 是 代价 函数 非 线 性 的 情况 下 的 自私 路 由 网 络 中 的 布雷 斯 

Fit. 

(a) 修改 布雷 斯 悖 论 (11.1.1 节 ) 从 而 证 明 : 在 代价 函数 非 线性 的 网 络 中 
加 一 条 边 ， 可 以 使 得 均衡 流 中 交通 流花 费 的 总 时 间 加 倍 。 

(b)〈H) 证 明 在 代价 函数 非 线性 的 网 络 中 加 一 些 边 ， 将 使 得 均衡 流 中 增加 
的 花费 时 间 严 格 大 于 原来 时 间 的 2 倍 。 


加 ”对 于 均衡 分 流 来 说 ， 最 大 时 间 代价 其 实 就 是 所 有 交通 流 的 共同 代价 。 
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上 一 章 证 明了 一 般 情况 下 的 自私 路 由 问题 的 无 秩序 代价 (POA) 的 严格 界 ， 这 个 
界 的 参数 为 边 的 代价 函数 。 这 些 界 中 的 一 个 特殊 实例 可 以 用 来 证 实 通信 网 络 中 的 超额 
配置 可 以 获得 良好 的 性 能 (12. 1 节 )。 通 信和 网 络 中 的 男 一 个 结果 表明 : 适当 的 技术 升 
级 比 独裁 控制 更 能 提高 网 络 性 能 (12. 2 节 ，12. 3 节 )。 一 个 网 络 中 ， 如 果 每 个 使 用 者 
占有 的 交通 流 份 额 不 可 忽视 ， 那 么 就 可 以 用 自私 路 由 的 “单元 ”变种 来 为 网 络 中 的 相 
关 应 用 建 模 。 单 元 自私 路 由 的 POA 比 “ 非 单元 ”模型 的 POA 大 得 多 ,但 在 代价 也 
数 为 仿 射 函数 ,或 者 为 更 一 般 的 “ 非 线 性 程度 不 太 高 ”的 函数 时 ， 单 元 自私 路 由 的 
POA 依然 是 有 界 的 (12.4 节 ，12.5 节 )。 


12.1 案例 分 析 : 网 络 超额 配置 


12.1.1 超额 配置 的 动机 


自私 路 由 的 研究 为 配置 各 种 各 样 的 网 络 提供 了 思路 ， 包 括 运输 、 通 信和 电力 网 
络 。 通 信 网 络 有 一 个 很 大 的 优势 ， 那 就 是 相对 其 他 网 络 而 言 ， 为 通信 网 络 增加 额外 的 
容量 比较 省 钱 。 因 此 ， 通 信 网 络 中 常用 的 策略 就 是 提供 超过 需求 的 容量 ， 而 这 意味 着 
网 络 往往 没有 被 完全 利用 。 网 络 超额 配置 的 一 个 动机 是 考虑 到 未 来 需求 的 增长 ， 此 
Sh, 超额 配 置 也 和 网 络 性 能 有 关 ， 因 为 实际 中 往往 发 现 ， 网 络 容 量 元 余 时 ， 掉 包 率 和 
延迟 都 比较 低 。 


12. 1.2 超额 配置 网 络 的 POA 界 


在 第 11 章 中 ,自私 路 由 的 POA 界 是 以 可 行 的 代价 函数 集 为 参数 。 在 这 一 节 中 ， 
我 们 考虑 代价 函数 c.(x) 的 形式 为 : 





C (ax) = 4 12. 13 


十 ce 22, 


参数 u, 代表 边 e 的 容量 。 式 (12. 1) 其 实 是 M/M/1 排队 模型 中 的 期 望 单位 延迟 ， 这 个 
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队列 的 任务 到 达 时 间 服 从 参数 为 zx 的 泊 松 分 布 ， 而 任务 被 服务 的 时 间 独 立地 服从 均值 
为 1/u, 的 指数 分 布 。 当 交通 流 接近 容量 限制 时 ， 代 价 快速 接近 十 oO， 除 此 之 外 ， 函 
数 变化 非常 平缓 (图 12. la)。 这 是 通信 网 络 中 为 延迟 建 模 所 使 用 的 最 简单 的 代价 
PRL 
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a) hM1M11 延 迟 函 数 b) 额外 容量 vs POA 曲线 
图 12.1 适当 的 超额 配置 可 以 保证 自私 路 由 近似 最 优 。 图 a 展示 的 是 单位 代价 c(x)==1/(u 一 xz)， 


这 里 将 交通 流 的 数量 工作 为 参数 ， 边 的 容量 u=2. Ab 展示 的 是 最 坏 情 况 下 的 POA, 
这 里 将 未 用 的 网 络 容量 份额 作为 参数 


对 于 参数 8E (0，1)， 代 价 函 数 形式 为 式 (12.1)， 若 对 于 所 有 边 e, WA I. < 
(1 一 Bu.， 其 中 三 为 均衡 分 流 ， 我 们 就 称 这 样 的 网 络 是 8- 超额 配置 的 。 也 就 是 说 在 均 
衡 分 流下 ， 网 络 中 边 的 最 大 利用 率 最 多 是 (1 一 8)* 100%。 

图 12. 1a 直观 上 显示 出 : 当 B 不 是 很 接近 0 时 ,均衡 分 流 中 任意 一 条 边 上 的 流量 
都 不 会 很 接近 其 容量 。 这 种 情况 下 ， 每 条 边 的 代价 函数 都 和 低 阶 的 非 负 因子 多 项 式 表 
现 类 似 。 定 理 11. 2 意味 着 有 类 似 代价 函数 的 网 络 的 POA 比较 小 。 

根据 定理 11.2， 对 任意 8- 超 额 配置 的 自私 路 由 网 络 计算 POA， 都 可 以 归 约 为 对 
8 -超额 配置 的 类 Pigou 示例 网 络 计算 最 坏 情况 POA。 有 例子 (练习 12. 2) 表 明 8- 超 额 
配置 网 络 中 最 坏 情况 POA 为 

+(14+ zi (12. 2) 
即 图 12. 1b 中 所 画 的 表达 式 。 

我 们 发 现 : 当 8 趋 于 1 时 ,， 式 (12.2) 趋 于 1; 8 趋 于 0 时 ， 式 (12.2) 趋 于 十 =o。 
这 两 种 情况 分 别 与 代价 函数 为 常 函 数 及 高 次 数 多 项 式 函 数 时 的 表现 类 似 。 但 有 趣 的 
是 ， 即 使 B 很 小 ，POA 上 界 也 不 会 很 大 。 比 如 说 ， 当 8=0.1， 即 边 的 最 大 利用 率 为 


90% 时 ，POA 最 多 为 2. 1。 因 此 少量 的 超额 配置 就 可 以 使 自私 路 由 趋 近 最 优 ， 这 与 
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12.2 资源 增 广 界 


这 一 节 要 证 明 在 对 代价 函数 没有 假设 的 情况 下 ,任意 自私 路 由 网 络 的 一 个 结论 。 
那 这 个 结论 是 什么 样子 呢 ? 回忆 Pigou 示例 (11.1.3 节 ) 的 非 线性 变种 表明 这 种 网 络 
的 POA 往往 都 是 无 界 的 。 

证 明 的 关键 是 一 个 对 比 ， 即 把 自私 路 由 的 性 能 和 一 个 有 修改 的 最 小 代价 解 的 性 能 
做 对 比 ， 修 改 体现 在 要 强制 传输 一 些 额 外 的 交通 流 。 比 如 说 ,在 图 11. 2b 中 ， 如 果 网 
络 有 1 个 单位 的 交通 流 且 p 很 大 ， 则 均衡 分 流 的 代价 为 1 而 最 优 分 流 的 代价 几乎 为 
0。 但 如 果 有 2 个 单位 的 交通 流 , 那么 结果 显而易见 : 最 优 分 流 为 1 一 e 个 单位 的 交通 
流 选 走 下 面 那 条 边 ， 剩 下 1 十 s 个 单位 的 交通 流 走 上 面 那 条 边 。 此 时 ， 最 优 分 流 的 代 
价 就 超过 了 只 传输 1 个 单位 交通 流 的 均衡 分 流 。 

在 流量 不 同 的 情况 下 比较 两 种 分 流 的 表现 ， 和 在 交通 流量 相同 但 代价 函数 不 同 的 
情况 下 比较 两 种 分 流 的 表现 效果 等 价 ， 但 后 者 更 容易 解释 。 直 观 理解 是 ,我们 允许 均 
衡 分 流 使 用 “更 快 的 ”网 络 一 一 即 代价 函数 从 原来 的 c.(z) 变 为 c,(z/2)/2， 而 不 是 强 
制 最 优 分 流传 输 额 外 交通 流 (练习 12. 3)。 

当代 价 函 数 形 如 式 (12. 1) 时 ， 这 个 转换 更 有 意义 。 如 果 clr) =l (wu 一 +)， 那 么 
“更 快 的 ”时 间 代 价 函 数 就 是 1/(2u. 一 x+)， 边 的 容量 加 倍 。 在 这 样 的 转换 下 ， 下 面 的 
结论 就 给 出 了 关于 网 络 超额 配置 的 第 二 个 判定 : 适当 的 技术 升级 比 进行 独裁 控制 更 能 
提升 网 络 性 能 。 

定理 12. 1( 资 源 增 广 界 ) 在 所 有 自私 路 由 网 络 中 ,， #r>0, MABARA rH 
均衡 分 流 的 代价 至 多 等 于 交通 流 率 为 2r 的 最 优 分 流 的 代价 。 

定理 12. 1 还 可 以 扩展 到 多 起 点 和 多 终点 的 自私 路 由 网 络 中 (练习 12.1). 


12.3 定理 12. 1 的 证 明 


固定 一 个 网 络 G， 代 价 函 数 非 负 、 连 续 且 非 减 ， 交 通 流 率 为 +。 令 和 f" 分 别 表 
示 交 通 流 率 为 r 的 均衡 分 流 和 交通 流 率 为 2r 的 最 小 代价 分 流 。 

证 明 的 第 一 部 分 用 到 了 证 明定 理 11.2 时 (11.5 节 ) 用 到 的 技巧 : 虚构 并 固定 均衡 
分 流 中 的 代价 ， 然后 再 处 理 最 优 分 流 f° 的 代价 。 注 意 f 是 均衡 分 流 ( 定 义 11.3)， 所 
以 f 用 到 的 所 有 路 径 P 的 代价 都 为 cs(f)， 写 作 上 。 又 因为 对 任意 路 径 PCP, BA 
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针对 虚构 的 固定 代价 ， 我 们 得 到 了 S 代价 的 一 个 漂亮 的 下 界 ， 即 均衡 分 流 代价 的 
两 倍 。 

证 明 的 第 二 部 分 表明 ,使 用 虚构 的 边 代 价 时 ，f°* 的 代价 超出 真实 的 部 分 至 多 和 
了 的 代价 相同 ” 。 也 就 是 说 ， 我 们 只 需要 证 明 以 下 不 等 式 就 可 以 完成 证 明 : 





DF atf Df. Cf) = Qife lf.) (12. 3) 
E ooo Jare 
FARM 2 Sr 


那么 接 下 来 就 只 需要 证 明 不 等 式 对 式 (12. 3) 中 求 和 符号 内 的 每 一 项 都 成 立即 可 ， 注 
意 ， 对 于 所 有 eCE MA: 

区 一 (12. 4) 
4 fi Sf. 时 ， 因 为 代价 函数 c. 非 负 且 非 减 ， 所 以 式 (12.4) 的 左边 非 正 ; 而 c 的 非 负 
性 则 意味 着 当 <S 时， 不 等 式 (12. 4) 也 成 立 。 证 毕 。 


12.4 单元 自私 路 由 


到 目前 为 止 ， 我 们 已 经 研究 了 自私 路 由 的 非 单 元 模型 ， 即 所 有 智能 体 所 占 交通 流 
的 份额 极 小 的 情况 。 这 对 高 速 公 路 上 的 汽车 ， 或 者 通信 网 络 中 的 小 型 用 户 进行 建 模 效 
果 都 很 好 。 本 节 将 介绍 单元 自私 路 由 网 络 ， 当 每 个 智能 体 都 能 控制 交通 流 中 相当 大 的 
份额 时 ， 单 元 自私 路 由 更 适用 。 比 如 说 ， 智 能 体 是 因特网 服务 器 运营 商 。 

单元 自私 路 由 网 络 由 有 向 图 G=(V，E) 和 A 个 智能 体 构 成 ， 其 中 边 的 代价 函数 
非 负 且 非 减 。 智 能 体 i 有 一 个 起 点 o; 和 一 个 终点 di。 每 个 智能 体 在 一 条 oi-d; 的 路 径 
上 传输 1 个 单位 的 交通 流 ， 同 时 他 还 会 想方设法 使 其 代价 最 小 化 ?>。 令 P, 表示 图 G 
H ord, 的 路 径 。 分 流 表示 成 向 量 (P1，…，Pi) 的 形式 ， 其 中 PEP, 为 智能 体 i 传输 
交通 流 的 路 径 。 分 流 的 代价 和 非 单 元 模型 相同 ， 如 式 (11. 3) 或 式 (11. 4)。 均 衡 分 流 为 
没有 任何 一 个 智能 体 可 以 通过 单方 面 改变 策略 来 减少 自身 代价 的 分 流 。 

定义 12. 2( 均 衡 分 流 ( 单 元 )) 若 对 每 个 智能 体 i 和 路 径 P,EP 有 


Def >) edt >) eft 
€P, 


ee PNP, e€ B, \ P, 





改变 策略 前 改变 生路 后 





日 式 (12.3) 中 ,不 等 式 左 侧 为 S 分 流 的 真实 代价 值 ， 不 等 式 右 侧 第 一 项 为 f 分 流 使 用 虚构 的 边 代价 
时 的 值 。 此 两 值 之 差 最 多 是 不 等 式 右 侧 第 二 项 的 大 小 。 一 一 译 者 注 

© ”这 个 模型 的 两 个 自然 变种 模型 分 别 是 允许 智能 体 控 制 不 同 数量 的 交通 流 和 将 交通 流 分 配 到 不 同 的 路 
径 上 。 对 于 这 两 个 变种 模型 ， 寻 找 最 坏 情况 下 的 严格 POA 界 ， 与 这 一 节 及 下 一 节 的 方法 紧密 相关 。 
相关 细节 详 见 说 明 。 
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则 分 流 (P| ，…，P,) 是 均衡 分 流 。 

定义 12.2 和 定义 11. 3 不同 的 原因 在 于 智能 体 大 小 不 能 忽略 时 ， 改 变 策 略 会 增加 
新 使 用 边 的 代价 。 

为 了 增加 对 单元 模型 的 感性 认识 ,考虑 图 12. 2 中 的 Pigou 示例 的 变种 。 假 设 
有 两 个 智能 体 ， 每 个 智能 体 控 制 一 个 单位 的 交通 流 。 最 优 解 是 一 条 边 一 个 智能 体 ， 
总 代价 为 1 十 2 二 3。 同 时 ， 这 也 是 一 个 均衡 分 流 ， 因 为 任何 一 个 智能 体 都 不 能 通过 
单方 面 改 变 策略 来 减少 代价 。 底 下 那 条 边 上 的 智能 体 不 会 想 换 到 上 面 去 ， 因 为 这 样 
他 的 代价 会 从 1 跳 到 2。 上 面 那 条 边 的 智能 体 ( 代 价 为 2) 也 没有 任何 动机 换 到 下 面 
那 条 边 ， 因 为 如 果 换 的 话 ， 下 面 那 条 边 的 代价 就 会 因 他 的 加 入 而 跳 到 2。 

在 网 络 中 还 有 第 二 个 均衡 分 流 : 如 果 两 aes 
个 智能 体 都 选择 底下 那 条 边 ， 那 么 两 个 智能 
体 的 代价 都 为 2， 而且 任何 一 个 智能 体 换 到 {L 
上 面 那 条 边 都 不 能 减少 自身 的 代价 。 这 个 均 
衡 的 代价 为 4。 这 个 例子 表明 了 单元 自私 路 Te 
由 和 非 单元 自私 路 由 的 一 个 区 别 : EALA “图 12.2 单元 自私 路 由 的 类 Pigou 示例 网 络 
私 路 由 模型 中 ,不 同 均衡 代价 相同 ( 见 第 13 
章 ); 而 单元 自私 路 由 模型 中 ， 不 同 均 衡 代价 可 以 不 同 。 

我 们 在 第 11 章 关 于 POA 的 定义 中 假设 所 有 均衡 代价 相同 。 接 下 来 ,我 们 会 用 最 
坏 情 况 将 这 个 定义 扩展 到 有 多 个 均衡 的 博弈 中 2 。 单 元 自私 路 由 的 无 秩序 代价 (POA) 
是 比值 

最 坏 情 况 均衡 分 流 的 代价 
最 优 分 流 的 代价 

例如 ， 图 12. 2 的 网 络 中 ，POA 为 4/3。° 

非 单 元 自私 路 由 和 单元 自私 路 由 的 另 一 个 区 别 是 : 后 者 的 POA 比 前 者 大 。 为 
了 验证 这 个 区 别 ， 考 虑 有 四 个 智能 体 的 双向 三 角 网 络 ， 如 图 12. 3 所 示 。 每 个 智能 
体 有 两 个 选择 ， 选 一 跳 的 路 径 和 选 两 跳 的 路 径 。 在 最 优 分 流 中 ， 每 个 智能 体 都 会 选 
一 跳 的 路 径 来 传输 。 这 些 一 跳 的 路 径 就 是 四 条 代价 函数 为 cCz) 王 工 的 边 ， 所 以 最 优 
分 流 的 代价 为 4。 这 个 最 优 分 流 也 是 均衡 流 。 另 一 方面 ， 如 果 每 个 智能 体 都 选择 两 
跳 的 路 径 来 传输 ， 那 么 我 们 就 能 得 到 第 二 个 均衡 分 流 ( 练 习 12.5)。 因 为 前 两 个 智 
能 体 的 代价 为 3， 后 两 个 代价 为 2， 所 以 此 时 分 流 的 代价 为 10。 这 个 网 络 的 POA 
为 10/4=2. 5. 

ARDY ROAD SY pa BAY oc A As NARSA REKA POA. 





日 ”其 他 方法 见 第 15 Fe. 
O 所 有 最 小 自私 路 由 网 络 的 POA 都 是 定义 完备 的 ， 因 为 每 个 这 样 的 网 络 都 至 少 有 一 个 均衡 分 流 ( 见 定 
理 13.6). 

















d,d,o, 


图 12.3 代价 函数 为 仿 射 函数 的 单元 自私 路 由 网 络 中 ，POA 可 以 为 5/2 


定理 12. 3( 单 元 自私 路 由 的 POA 界 ) 在 代价 函数 为 仿 射 函数 的 单元 自私 路 由 网 
络 中 ，POA 至 多 为 5/2。 
定理 12. 3 及 其 证 明 可 以 扩展 到 任意 代价 函数 集合 的 严格 POA 界 ， 详 见 说 明 。 


12.5 定理 12. 3 的 证 明 


定理 12. 3 的 证 明 是 “典型 的 POA 证 明 ”， 第 14 章 会 讲 得 更 精确 。 要 找 出 所 有 均 
衡 分 流 的 界 ， 先 从 任意 选 定 一 个 分 流 f 开始 。 令 广 表示 最 小 代价 分 流 ，f. 和 f。 分 
IRR f AS 中 使 用 边 e 的 智能 体 数 目 。 仿 射 代价 函数 写作 cl) Satb Hp 
a, 6.20. 

证 明 的 第 一 步 是 假设 了 是 一 个 均衡 分 流 。 考 虑 在 f 中 使 用 路 径 P; 的 任意 智能 体 
i， 以 及 其 单方 面 改变 策略 后 的 另 一 条 路 径 户 ,， 那 么 我 们 就 能 得 出 这 个 结论 : 在 均衡 
下 i 使 用 P; 的 代价 至 多 为 其 转 而 使 用 忆 的 代价 (定义 12. 2) 。 我 们 想 要 得 到 均衡 分 流 
和 了 的 代价 的 上 界 ， 而 假设 单方 面 改 变 策略 就 正好 给 出 了 单个 智能 体 均 衡 代 价 的 上 界 。 
由 于 f° 是 定理 中 除了 外 唯一 的 对 象 ， 所 以 很 自然 的 想法 就 是 将 最 优 分 流 广 视 为 智能 
体 i 单 方面 偏离 均衡 后 的 分 流 。 

假设 智能 体 i 在 了 中 选择 路 径 P;， 在 f* 中 选择 路 径 P 。 根 据 定义 12. 2， 有 

Dye fa) < Self D aff (12. 5) 


ecEP NP, EPT NP, 
这 就 完成 了 第 一 步 ， 我 们 利用 均衡 分 流 的 假设 得 到 了 每 个 智能 体 均衡 代价 的 上 界 
CGAI. 5)).. 
证 明 的 第 二 步 ， 将 所 有 智能 体 个 人 的 均衡 代价 上 界 ( 式 (12. 5)) 相 加 ， 得 到 总 的 均 
衡 代价 上 界 : 
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k k 
DYPedosD D ao + M ef.+D) (12. 6) 


i=1 «EP, i=l eeP” NP, cE PS \P, 
F 的 代价 

k 
<2 its +1) (12.7) 
sel 

= J fi ee fe+1) (12. 8) 
EE 
= Ņ [afi (f+ D+bf2] (12. 9) 


e€E 


其 中 不 等 式 (12. 6) 来 自 式 (12.5); 假设 代价 函数 非 减 的 情况 下 ， 不等式 (12.7) 成 立 ; 又 
由 于 对 于 每 个 e€ P; 的 智能 体 i,，c,(f 十 1) 项 都 要 计算 一 次 (总 共 大 次 )， 等 式 (12. 8) 
成 立 ; 根据 假设 ,代价 函数 是 仿 射 函 数 ， 等 式 (12.9) 成 立 。 证 明 的 第 二 步 结 束 。 

以 上 证 明 过 程 以 一 个 我 们 不 关心 的 量 ( 纠 缠 在 一 起 的 和 广 ) 给 出 了 我 们 关心 的 均 
衡 分 流 了 代价 的 上 界 。 所 以 证 明 的 第 三 步 ， 同 时 也 是 最 有 技术 性 的 步骤 就 是 要 将 
式 (12.9)“ 拆 解 ” 开 来 ， 并 将 其 和 我 们 所 关心 的 POA 界 一 一 f 和 f° 的 代价 联系 起 来 。 

第 三 步 我 们 利用 一 个 很 容易 证 明 的 不 等 式 ( 练 习 12. 6) 。 

引 理 12.4 FA y, zE{0, 1, 2, 3, =) Æ 


Reti < oy +42 


现在 ， 令 y 二 f; ，z 二 f.， 对 式 (12. 9) 右 边 的 每 条 边 都 应 用 一 次 引 理 12.4。 利 用 
关于 分 流 的 代价 C(*) 的 定义 式 (11.4)， 得 到 


cn< Dla(Zer+gh)ros: | 


= Pt (af! +6,)]+ 3 Daf: 


<2-c Ei +. CP) (12. 10) 
两 边 同时 减 去 地 CC/) 并 乘 以 也 得 到 
; 5 3 ee ae 
ANL. ŽL CC ) = 2 Crp) 


定理 12. 3 证 毕 


总 结 


e 若 均 衡 分 流 中 ， 每 条 边 上 的 交通 流 至 多 为 (1 一 B)u.， 则 称 代价 函数 形式 为 
c.(T) 二 1/(u, 一 x) 的 自私 路 由 网 络 是 8- 超额 配置 的 。 
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即使 8 很 小 ,8 -超额 配置 网 络 的 POA 也 很 小 ， 这 印证 了 : 在 实际 中 ,少量 的 

超额 配置 可 以 提升 网 络 性 能 。 

均衡 分 流 的 代价 至 多 是 传输 两 倍 交通 流量 的 最 优 分 流 的 代价 。 也 就 是 说 ， 适 

当 的 技术 升级 比 进行 独裁 控制 更 能 提升 性 能 。 

e 单元 自私 路 由 中 ， 每 个 智能 体 都 能 控制 网 络 交通 流量 中 不 可 忽视 的 一 部 分 ， 
不 同 的 均衡 分 流 的 代价 可 能 不 同 。 

© POA 为 最 坏 均衡 分 流下 与 最 优 分 流下 目标 函数 的 比值 。 

最 坏 情 况 下 ,代价 函数 为 仿 射 函数 的 单元 自私 路 由 的 POA 为 2.5。 其 证 明 过 

程 很 有 代表 性 。 


说 明 


关于 通信 网 络 模型 ，Bertsekas 和 Gallager(1987) 是 不 错 的 参考 ; 而 对 于 通信 网 
络 中 的 管理 策略 ， 比 如 超额 配置 ， 可 以 参考 Olifer 和 Olifer(2005)。B8 超额 配置 网 络 
的 POA RA Roughgarden(2010a) 中 被 讨论 。 定 理 12. 1 来 自 Roughgarden 和 Tardos 
(2002) 。 单 元 自私 路 由 网 络 首次 出 现在 Rosenthal(1973) ， 其 网 络 POA 则 是 由 Awer- 
buch 等 (2013) 及 Christodoulou 和 Koutsoupias(2005b) 首 次 研究 。 定 理 12. 3 的 证 明 
来 自 Christodoulou 和 Koutsoupias(2005a)。 利 用 最 坏 情 况 下 的 均衡 来 定义 POA 由 
Koutsoupias 和 Papadimitriou(1999) 首 次 提出 。 在 代价 函数 为 多 项 式 函 数 的 情况 下 ， 
单元 自私 路 由 网 络 的 严格 POA 界 可 以 参考 Aland 等 (2011); 代价 函数 更 一 般 的 情况 
可 以 参考 Roughgarden(2015)。 关 于 智能 体 控 制 不 同 交通 流 数 量 的 严格 POA 界 的 资 
料 见 Awerbuch 等 (2013) ，Christodoulou 和 Koutsoupias(2005b), Aland 等 (2011)， 
以 及 Bhawalkar 等 (2014) 。 针 对 可 以 将 交通 流 分 配 到 几 个 不 同 的 路 径 上 的 智能 体 的 情 
ti, POA 界 首次 出 现在 Cominetti 等 (2009) 和 Harks (2011), 严格 的 POA 界 出 自 
Roughgarden 和 Schoppmann(2015)。 在 所 有 这 些 单 元 模型 中 ， 当 边 的 代价 函数 是 系 
数 非 负 且 次 数 至 多 为 p HETARA. POA 界 由 与 p 相关 的 常数 确定 。 这 个 常数 
是 p 的 指数 函数 ， 而 在 非 单元 自私 路 由 网 络 中 ， 这 个 常数 是 p 的 次 线性 函数 。 问 题 
12. 1 一 12.4 分 别 来 自 Chakrabarty (2004)，Christodoulou 和 Koutsoupias (2005b)， 
Koutsoupias 和 Papadimitriou(1999) ， 以 及 Awerbuch 等 (2006)。 


练习 


练习 12.1 多 物品 自私 路 由 网 络 的 定义 在 练习 11.5 中。 将 定理 12.1 扩展 到 此 类 网 
络 中 。 
练习 12.2 此 练习 要 证 明 , 在 8- 超 额 配置 网 络 中 ， 最 坏 情 况 下 的 POA 至 多 如 
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练习 12.3 


练习 12.4 


练习 12.5 


练习 12.6 


问题 


问题 12. 1 


问题 12. 2 


问题 12. 3 


式 (12. 2) 所 示 。 
(a) WEH, Æ% Pigou 示例 的 网 络 中 (11. 3 节 )， 如 果 交 通 流 率 为 +-， 下面 
边 的 代价 函数 为 1/(x 一 z) 且 u>r, M POA 如 式 (12.2) 所 示 ， 其 中 


ji, 
(b) 由 以 下 定义 





5 re ctr) 
Qo = su su su 
E= SUR erea oe Le e en a) + re ph or 


可 以 将 Pigou 界 扩展 到 8 -超额 配置 网 络 ， 其 中 c 表示 代价 函数 

1/(u—x). 证明， 对 于 任意 BECO, 1), op 等 于 式 (12. 2), 
Cc) (CH) 证 明 所 有 8- 超额 配置 网 络 的 POA 都 至 多 如 式 (12.2) 所 示 。 
证 明 下 列 论述 等 同 于 定理 12. 1: 如 果 f° 是 代价 函数 为 c 的 自私 路 由 网 络 
中 的 最 小 代价 分 流 ，f 是 同一 个 网 络 中 代价 函数 为 的 均衡 分 流 ， 其 中 
C.(z) 为 c.(z/2)/2， 则 

cup ACH 

其 中 C AIC 分别 表 示 代 价 函 数 为 © 和 < 时 分 流 (11.3) 的 代价 。 
证 明定 理 12. 1 的 一 般 化 情形 : 对 于 所 有 自私 路 由 网 络 和 rr，6 宝 0， 交 通 
流 率 为 + 的 均衡 分 流 的 代价 至 多 为 交通 流 率 为 (1 十 0)r 的 最 优 分 流 的 1/ 
ò fÈ o 
验证 在 图 12. 3 的 网 络 中 ， 如 果 每 个 智能 体 都 将 他 的 交通 流 分 配 到 两 跳 的 
路 径 上 ， 那 么 结果 是 一 个 均衡 分 流 。 
CH) HEAR S| HH 12. 4。 


CH) 在 代价 函数 为 仿 射 函数 的 自私 路 由 网 络 中 , 证 明定 理 12. 1 的 更 强 版 

本 : 在 每 个 类 似 的 网 络 中 ， 交 通 流 率 > 0 的 均衡 分 流 的 代价 至 多 和 交通 

分 流 率 为 5r/4 的 最 优 流 相同 。 

回想 图 12. 3 中 有 4 个 智能 体 的 单元 自私 路 由 网 络 ， 其 POA 为 2. 5。 

(a) 对 于 一 个 不 同 的 网 络 ， 证 明 即 使 只 有 三 个 智能 体 时 ,代价 函数 为 仿 射 
函数 的 单元 自私 路 由 的 POA 都 可 以 是 2. 5。 

(b) 当 只 有 两 个 智能 体 且 代价 函数 为 仿 射 函数 时 ， 单 元 自私 路 由 网 络 的 
POA 可 以 是 多 大 ? 

本 问题 研究 以 下 场景 :个 智能 体 ， 智能 体 i 权重 w; 为 正 。 有 m 个 相同 

的 机 器 。 每 个 智能 体 选 择 一 个 机 器 ， 并 要 最 小 化 他 所 选择 的 机 器 的 负载 ， 
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问题 12. 4 
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这 里 负载 为 选择 这 人 台 机 器 的 智能 体 的 权重 之 和 。 本 问题 的 目标 是 要 最 小 

化 工期 ， 这 里 工期 是 指 一 台 机 器 的 最 大 负载 的 值 。 定 义 纯 策 略 纳什 均衡 

为 : 将 机 器 分 配给 智能 体 后 ， 没 有 一 个 智能 体 可 以 通过 单方 面 选择 另 一 

个 机 器 来 减 小 他 的 负载 。 

Ca) (H) 证 明 : 纯 策 略 纳什 均衡 的 工期 至 多 是 最 小 值 的 两 倍 。 

(b) 证 明 : 4k Alm 赵 于 无 穷 时 ， 纯 策略 纳什 均衡 的 工期 可 以 无 限 接近 
最 小 值 的 两 倍 。 

本 问题 对 问题 12. 3 中 的 模型 在 两 方面 进行 修改 。 第 一 。 每 个 智能 体 的 权 

重 是 单位 权重 。 第 二 ， 每 个 智能 体 i 必须 从 m 个 机 器 的 子 集 S, 中 选择 

机 器 。 

(a) 证 明 : 对 于 任意 常数 < 三 1， 当 智能 体 和 机 器 足够 多 时 ， 纯 策略 纳什 
均衡 的 工期 可 能 超过 最 小 可 行 工 期 的 a 售 ( 每 个 智能 体 i 都 从 他 的 子 
SS, 选择 机 器 )。 

(b) EH: 存在 一 个 常数 a 二 0 使 得 每 个 纯 策 略 纳什 均衡 的 工期 至 多 是 最 
小 值 的 aln m 倍 。 你 能 得 到 与 m 有关 的 更 紧 的 界 吗 ? 
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均衡 : 定义 、 示 例 和 存在 性 





单元 自私 路 由 网 络 中 的 均衡 分 流 ( 定 义 12.2) 是 纯 策 略 纳什 均衡 的 一 种 形式 ， 因 
为 这 些 智能 体 不 会 随机 选择 路 径 。 石 头 -剪刀 - 布 博弈 (1. 3 节 ) 告 诉 我 们 ， 有 些 博弈 是 
没有 纯 策 略 纳什 均衡 的 。 那 什么 时 候 纯 策略 纳什 均衡 一 定 存在 呢 ? 对 于 那些 没有 纯 策 
略 纳什 均衡 的 博弈 ， 我 们 又 该 怎么 分 析 呢 ? 

13. 1 节 引 入 了 纯 策略 纳什 均衡 的 三 种 “宽松 ”版 本 ， 每 一 种 都 比 前 一 种 更 容易 计 
算 和 处 理 。 这 三 种 均衡 概念 在 有 限 博弈 中 都 一 定 存在 。13. 2 节 证 明了 每 一 个 路 由 博弈 
都 至 少 有 一 个 纯 策 略 纳什 均衡 。13. 3 节 概 括 了 前 面 的 观点 并 定义 了 势 博弈 的 种 类 。 


13. 1 均衡 概念 的 层级 结构 


许多 博弈 没有 纯 策 略 纳什 均衡 。 除 了 石头 -前 刀 - 布 ， 另 一 个 例子 就 是 单元 自私 路 
由 的 一 般 版 本 ， 其 中 智能 体 的 流量 规模 不 同 ( 练 习 13.5)。 为 了 能 对 此 类 博弈 的 均衡 
进行 一 些 有 意义 的 分 析 ， 比 如 分 析 其 无 秩序 代价 ， 我 们 需要 扩展 均衡 的 集合 从 而 保证 
存在 性 。 图 13. 1 展示 了 本 节 定 义 的 均衡 概念 的 层级 结构 。 第 14 章 将 证 明 这 些 均 衡 概 
念 在 不 同 博弈 中 最 坏 情况 下 的 性 能 保证 。 
非常 容易 计算 





容易 计算 


一 定 存在 但 很 难 计算 


图 13.1 均衡 概念 的 层级 结构 : 纯 策 略 纳什 均衡 (Pure Nash Equilibria，PNE)、 混 合 策略 纳什 均 
衡 (Mixed Nash Equilibria，MNE)、 相 关 均 衡 (Correlated Equilibria, CE) 和 粗糙 相关 均 
ff (Coarse Correlated Equilibria, CCE) 








13.1.1 代价 最 小 化 博弈 


代价 最 小 化 博弈 由 以 下 部 分 组 成 : 

e 有 限 的 & 个 智能 体 。 

© 对 于 每 个 智能 体 i， 都 存在 一 个 有 限 的 纯 策 略 集 ， 或 简称 策略 集 S;。 

© 对 于 每 个 智能 体 i， 都 存在 一 个 非 负 的 代价 函数 C;(s)， 其 中 se SiX…X Si 表 

示 策 略 组 合 或 者 博弈 局 势 。 

比如 ， 每 个 单元 自私 路 由 网 络 都 对 应 一 个 代价 最 小 化 博弈 ， 其 中 Ci(s) 表 示 给 定 
其 他 智能 体 选 好 的 路 径 ， 智 能 体 i 在 自己 选择 的 路 径 上 花费 的 时 间 。 

备注 13. 1( 收 益 最 大 化 博弈 ) 在 收益 最 大 化 博弈 中 ， 将 每 个 智能 体 i 的 代价 函数 
C 换 成 收益 肖 数 x;。 其 实 这 样 的 定义 更 符合 传统 的 博弈 ， 如 1.3 节 中 石头 -剪刀 - 布 博 
弈 。 相 似 的 ， 在 收益 最 大 化 博弈 中 ， 其 他 的 均衡 定义 都 需要 稍微 修改 一 下 一 一 将 所 有 
不 等 式 反 向 。 代 价 最 小 化 博弈 和 收益 最 大 化 博弈 其 实 是 等 价 的 ， 但 是 在 大 多 数 应 用 场 
景 中 ， 某 一 个 会 比 另 一 个 使 用 起 来 更 自然 。 


13.1.2 纯 策略 纳什 均衡 


在 一 个 博弈 局 势 下 ， 如 果 一 个 智能 体 单 方面 的 策略 改变 只 能 增加 其 自身 代价 ， 那 
么 称 此 局 势 为 一 个 纯 策 略 纳 什 均衡 。 

定义 13. 2( 纯 策略 纳什 均衡 (PNE)) 若 对 于 任意 一 个 智能 体 i€E {1，2，…，A} 和 
其 单方 面 策 略 改 变 s' CS. WA 

G(s) < C;(s; ,s—i) (13. 1) 
则 称 这 样 的 策略 组 合 s 是 代价 最 小 化 博弈 的 一 个 纯 策略 纳什 均衡 。 

其 中 s_; 表 示 策 略 组 合 s 中 去 除 第 i 个 元 素 的 组 合 。 根 据 定义 ,在 PNE H, YA 
智能 体 i 的 策略 s: 都 是 对 s-; 的 最 佳 应 对 策略 ， 即 在 所 有 CS, 中 它 能 最 小 化 
Ci(s;, S~), BI PNE 解释 起 来 很 容易 ， 但 就 像 之 前 提 到 的 ， 大 多 数 博弈 中 并 不 存 
在 PNE。 


13.1.3 混合 策略 纳什 均衡 


第 1 章 中 介绍 了 智能 体 通 过 混合 策略 来 随机 化 自身 策略 的 思想 。 在 一 个 混合 策略 
纳什 均衡 中 ， 智 能 体 独 立地 随机 化 自身 策略 ， 且 一 个 智能 体 单方 面 改变 策略 只 会 增加 
自身 的 期 望 代 价 。 

定义 13. 3( 混 合 策略 纳什 均衡 (MNE)) 若 对 于 任意 一 个 智能 体 i€ 11，2，… 
有 } 和 其 单方 面 策 略 疏 变 SCS, WA 

j E T RE << EG tt a] (13. 2) 
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其 中 表示 联合 概率 分 布 Sal X… Xa， 我 们 就 称 策略 集 S1 ，…，S 上 的 分 布 oi KX 
ok 是 代价 最 小 化 博弈 的 一 个 混合 策略 纳什 均衡 。 

定义 13. 3 只 考虑 了 单方 面 改变 到 纯 策略 的 情况 ， 其 实 即使 允许 改变 到 其 他 混合 
策略 也 不 会 与 这 个 定义 冲突 (练习 13. 1) 。 

每 个 PNE 也 都 是 一 个 MNE， 只 不 过 所 有 智能 体 的 策略 都 是 确定 性 的 。 石 头 - 剪 
刀 - 布 博弈 表明 ， 一 个 博弈 可 以 有 不 是 PNE 的 MNE, 

在 第 20 章 我 们 会 讨论 与 此 相关 的 两 个 事实 。 第 一 个 事实 是 ， 每 个 代价 最 小 化 博 
弈 都 至 少 有 一 个 MNE。 我 们 可 以 利用 与 博弈 局 势 相 关 的 目标 函数 ， 将 代价 最 小 化 博 
弈 中 MNE 的 POA 定义 为 


最 坏 MNE 的 期 望 目 标 函 数值 
最 好 局 势 的 目标 函数 值 


第 二 个 事实 是 ， 即 使 只 有 两 个 智能 体 ， 计 算 MNE 也 是 一 个 困难 的 问题 ?> 。 这 就 
引起 了 我 们 的 担忧 ， 因 为 研究 MNE 的 POA 界 未 必 是 有 意义 的 。 对 于 智能 体 不 能 迅 
速达 到 均衡 状态 的 博弈 ， 我 们 为 什么 要 关心 均衡 的 性 能 呢 ? 这 个 问题 驱使 人 们 去 寻找 
更 宽松 且 更 容易 计算 的 均衡 概念 。 


(13. 3) 





13.1.4 相关 均衡 


下 一 个 均衡 概念 需要 我 们 花 一 点 时 间 来 理解 。 我 们 首先 给 出 定义 ， 然 后 解释 相关 
术语 ， 最 后 展示 一 个 例子 。 


定义 13. 4( 相 关 均 衡 (CE)) 若 对 于 任意 一 个 智能 体 i€E (1，2，…， k} 策略 
SES 及 其 单方 面 策 略 改 变 s' ES, WA 
E,~,LC,(s) ] eR Lt |] (13. 4) 


则 称 局 势 集合 SI X… XS, 上 的 分 布 o 是 代价 最 小 化 博弈 的 一 个 相关 均衡 。 

要 注意 的 是 ,定义 13.4 中 的 o 不 一 定 是 联合 概率 分 布 ; 也 就 是 说 ， 智 能 体 选择 的 
策略 是 相关 的 。MNE 对 应 一 个 联合 分 布 CE( 练 习 13. 2) 。 因 为 MNE 一 定 存在 ， 所 以 
CE 也 一 定 存在 。 还 可 以 从 “交换 函数 ”的 角度 对 CE 完成 相同 的 定义 (练习 13.3). 

为 解释 相关 均衡 ， 通 常 要 引入 一 个 信任 的 第 三 方 。 局 势 的 分 布 c 是 公共 已 知 的 。 
信任 的 第 三 方 会 根据 o 抽取 一 个 局 势 s 的 样本 。 对 于 所 有 智能 体 i=1, 2, +, k, 
三 方 会 私下 建议 智能 体 i 选择 策略 5,。 智 能 体 i 可 以 选择 使 用 建议 的 策略 5;， 也 可 以 
选择 不 使 用 。 在 做 决定 的 时 候 ， 和 拘 能 体 i 知道 分 布 o 以 及 局 势 s 中 一 个 元 素 ;;; A 
应 的 ， 智 能 体 i 还 对 第 三 方 建议 其 他 智能 体 使 用 的 策略 s_; 有 一 个 后 验 分 布 估计 。 相 
关 均 衡 ( 式 (13. 4) ) 要 求 对 于 所 有 智能 体 ， 使 用 第 三 方 建议 的 策略 s 能 最 小 化 其 期 望 


日 ”原文 此 处 使 用 了 “乘积 概率 分 布 ”(product distribution) 一 词 。 在 随机 变量 相互 独立 的 情况 下 ， 乘 积 
概率 分 布 与 联合 概率 分 布 相 等 。 下 文中 我 们 都 使 用 “联合 概率 分 布 "。 一 一 译 者 注 
O 更 精确 的 表述 会 用 到 类 似 .NP 完全 性 的 一 个 理论 ， 这 个 理论 适用 于 均衡 计算 问题 (参见 第 20 章 )。 
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代价 。 这 个 期 望 是 在 假设 其 他 智能 体 使 用 第 三 方 建议 的 策略 的 情况 下 ， 基 于 智能 体 i 
知道 的 信息 c Alls, 计算 得 到 的 。 

红绿灯 就 是 一 个 属于 CE 但 不 属于 MNE 的 很 好 的 示例 。 考 虑 以 下 两 个 智能 体 的 
博弈 ， 和 矩阵 的 行列 分 别 表 示 不 同 智能 体 ， 和 矩阵 内 的 单元 值 表示 智能 体 采取 一 定 行动 后 
对 应 的 代价 : 


停 走 


停 1. 1 1, 0 
走 Os 1 Gir: 5 





其 中 ， 等 红 灯 代 价 适中 为 1， 发生 车 祸 代价 很 大 为 5。 这 个 博弈 有 两 个 PNE，( 停 ， 
走 ) 和 ( 走 ， 停 )。 令 o 为 这 两 个 局 势 的 随机 均匀 分 布 。 注 意 这 并 不 是 整个 博弈 四 个 局 
势 上 的 联合 分 布 ， 所 以 它 不 是 MNE, 但 是 它 是 一 个 CE。 比 如 ， 考 虑 行 智能 体 ， 如 果 
第 三 方 (例如 信号 灯 ) 建 议 选择 策略 “ 走 ”( 信 号 灯 为 绿 )， 那 么 行 智能 体 就 知道 列 智能 
体 得 到 的 建议 是 “ 停 ”( 信 号 灯 为 红 )。 假 设 列 智能 体 选择 了 第 三 方 建议 的 策略 一 一 红 
灯 停 ， 那 么 行 智 能 体 的 最 优 策 略 就 是 听从 第 三 方 的 建议 一 一 绿灯 行 。 类 似 的 ， 若 行 智 
能 体 被 告知 要 “ 停 >， 那 么 他 就 会 假设 列 智 能 体会 “ 走 ”， 在 这 个 假设 下 , “ 停 ” 就 是 
最 优 策略 。 

第 18 章 证 明了 ，CE 不 像 MNE， 它 不 是 计算 困难 的 。 甚 至 还 存在 分 布 式 的 算法 
能 引导 博弈 朝 着 CE 收敛 。 所 以 ， 可 以 将 式 (13.3) 中 的 MNE 替换 为 CE， 并 据 此 分 析 
CE 的 POA 的 界 。 这 就 是 一 个 有 意义 的 均衡 的 性 能 保障 分 析 。 


13. 1.5 粗糙 相关 均衡 


我 们 已 经 有 了 一 些 积极 的 结果 ， 比 如 良好 的 POA 界 ， 这 个 界 还 可 以 应 用 在 CE 
这 个 易于 计算 的 集合 上 。 但 是 先 将 这 个 成 果 放 在 一 边 ， 进 一 步 扩大 均衡 的 集合 ， 以 便 
得 到 一 个 “更 容易 处 理 ” 的 均衡 概念 。 

定义 13. 5( 粗 糙 相 关 均 衡 (CCE)) 若 对 于 任意 一 个 智能 体 i€ (1, 2, +, kho 
及 其 单方 面 策 略 改变 ES, WA 

E,..,(CA®)] EL sz) (13. 5) 

则 称 局 势 集 合 SX KS, 上 的 分 布 o 是 代价 最 小 化 博弈 上 的 一 个 粗糙 相关 均衡 。 

除了 不 再 要 求 是 联合 分 布 之 外 ,条 件 (13.5) 和 MNE 的 条 件 (13. 2) 一 样 。 在 这 个 
条 件 下 ， 当 智能 体 i 考虑 策略 改变 到 s' 时 ， 他 只 知道 分 布 o 而 不 知道 实际 的 s;。 换 句 话 
Bi, CCE 只 防止 无 条 件 的 单方 面 策略 改变 ， 而 不 像 定 义 13.4 中 以 gs 为 条 件 。 每 一 个 CE 
也 都 是 一 个 CCE， 因 此 CCE 一 定 存 在 且 容 易 计 算 。 第 17 章 的 内 容 将 告诉 我 们 ， 某 些 分 
布 式 的 学 习 算 法 能 引导 博弈 快速 收敛 到 CCE 集合 上 去 ， 并 且 这 样 的 算法 比 CE 的 分 布 式 
算法 更 简单 、 更 自然 。 
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13. 1.6 示例 


接 下 来 ,我们 利用 一 个 实际 例子 来 加 强 对 图 13. 1 中 4 个 均衡 概念 的 直观 理解 。 
考虑 有 四 个 智能 体 的 单元 自私 路 由 网 络 (12. 4 节 )。 网 络 很 简单 ， 有 一 个 公共 起 点 o， 
公共 终点 d, 边 集 E={0, 1, 2, 3，4，5} 分 别 表示 6 条 平行 的 0-d 边 。 每 条 边 的 代 
Pt BBN c(CZz) 王 工 。 

纯 策 略 纳什 均衡 就 是 每 个 智能 体 选择 不 同 的 边 。 每 个 智能 体 在 纯 策 略 纳什 均衡 
中 的 代价 为 1。 一 个 明显 不 是 纯 策 略 的 混合 策略 纳什 均衡 为 ， 每 个 智能 体 独立 、 随 
机 且 均 匀 地 选择 一 条 边 ， 每 个 智能 体 在 混合 策略 纳什 均衡 中 的 期 望 代 价 为 3/2。 满 
足 一 条 边 上 有 了 两 个 智能 体 且 有 另外 两 条 边 上 分 别 有 一 个 智能 体 的 局 势 有 多 种 ， 这 些 
局 势 上 的 均匀 分 布 就 是 一 个 相关 均衡 ( 非 联合 的 )。 这 是 因为 对 所 有 i s Ms 来 
说 ， 式 (13. 4) 的 两 边 都 是 3/2。 如 果 上 述 这 样 的 智能 体 选 边 的 结果 只 能 是 边 集 {0， 
2，4} 或 (1，3，5}， 那 么 在 这 两 个 边 集 上 的 均匀 分 布 就 是 一 个 粗糙 相关 均衡 。 这 
是 因为 对 所 有 i 和 s 来 说 ， 式 (13.5) 的 两 边 都 是 3/2。 注 意 这 不 是 一 个 相关 均衡 ， 
因为 智能 体 i 被 建议 选择 边 s; 时 ,他 可 以 改变 策略 到 s; ， 即 旁边 的 边 ( 即 按照 边 集 
中 的 数 对 6 取 模 之 后 的 值 计数 )， 从 而 将 他 的 条 件 期 望 代价 降 到 1。 


13.2 纯 策 略 纳什 均衡 的 存在 性 


本 节 会 证 明 单 元 自私 路 由 网 络 存在 均衡 分 流 (13. 2. 1 节 )， 也 会 证 明 在 非 单 元 自私 
路 由 网 络 中 均衡 分 流 是 唯一 的 (13. 2. 2 节 )， 本 节 最 后 还 会 介绍 拥塞 博弈 (13. 2. 3 节 ) 。 


13.2.1 均衡 分 流 的 存在 性 


在 12. 4 节 我 们 就 断定 了 最 小 自私 路 由 网 络 是 特殊 的 博弈 ， 因 为 它 总 是 存在 一 个 
纯 策略 均衡 分 流 。 现 在 我 们 就 来 证 明 这 个 结论 。 
定理 13. 6( 路 由 博弈 中 PNE 的 存在 性 ) 所 有 最 小 自私 路 由 网 络 都 存在 至 少 一 个 
均衡 分 流 。 
证 明 : 定义 单元 自私 路 由 网 络 中 关于 分 流 的 一 个 函数 : 
fe 
&(f) = >} Fei (13. 6) 


EE :一 1 


其 中 f, 表示 在 分 流 f 中 使 用 边 e 的 智能 体 数 目 。 式 (13. 6) 中 靠 内 侧 的 求 和 符号 是 代 
价 函 数 c. 曲线 下 的 面积 ; 见 图 13.2。 而 式 (11.4) 所 示 的 目标 代价 函数 中 f.，c.(f,) 项 
对 应 图 13. 2 中 的 阴影 部 分 。” 





日 更 函数 和 目标 代价 函数 的 相似 性 很 有 用 ， 详 见 第 15 章 。 
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考虑 分 流 f. BHA i 使 用 了 中 的 od; 路 径 已 ， 并 可 能 改变 策略 选择 其 他 od, 
路 径 户 ,。 令 了 表示 智能 体 i MP, 变 到 户 后 的 分 流 。 
我 们 断言 

MP — OA) = Def — Def) 


c+) 


(13. 7) 
具体 说 就 是 ， 在 智能 体 单方 面 改 变 策略 偏离 均衡 的 
情况 下 ，g 函数 的 变化 和 偏离 智能 体 自身 代价 的 变 
化 相同 。 因 此 ， 只 需要 一 个 函数 @ 就 可 以 同时 描述 
每 个 智能 体 的 偏离 所 带 来 的 影响 。 图 13.2 边 e 对 势 函 数 $ 和 目标 

为 证 明 式 (13. 7) ,我们 需要 考察 当 智 能 体 i 从 aa 

P, BAP, BRR O 如 何 变化 。 如 果 边 e 在 户 中 而 不 在 P, 中 ， 势 函数 中 有 关 边 e 
的 项 就 多 了 一 个 c.(f, 十 1); MRH eE P 中 而 不 在 户 ,中 , 势 函 数 中 有 关 边 。 的 项 
就 少 了 一 个 ， 成 为 c.(f.)。 因 此 ， 式 (13.7) 左 边 等 于 


DS ehd- X ef) 


“EF \P, r€ P, \ Ê, 
这 其 实 和 式 (13.7) 右 边 是 一 样 的 。 
考虑 能 最 小 化 @ 的 分 流 f。 因 为 可 能 的 分 流 的 数目 是 有 限 的 ， 所 以 能 最 小 化 @ 的 
分 流 一 定 存在 。 并 且 分 流 f 中 任何 智能 体 单 方面 改变 策略 都 青 也 不 能 减少 5。 根 据 式 
(13.7)， 也 没有 任何 智能 体能 够 通过 单方 面 改变 策略 来 减少 自身 的 代价 ， 所 以 f 是 一 
个 均衡 分 流 。 证 毕 。 m 





13.2.2 非 单元 均衡 分 流 的 唯一 性 


本 节 将 简略 介绍 一 个 和 定理 13. 6 类 似 的 定理 ， 这 个 定理 基于 第 11 章 中 介绍 的 非 
单元 自私 路 由 网 络 。 因 为 在 这 种 网 络 中 ， 每 一 个 智能 体 的 流量 都 极 小 ， 所 以 我 们 可 以 
将 式 (13. 6) 中 内 侧 的 求 和 换 成 积分 : 


A 
AN = D f| eda (13. 8) 
ec EY? 


其 中 f. 表示 分 流 f PURE e 的 交通 流 数 量 。 因 为 边 的 代价 函数 是 连续 且 非 减 的 ， 
所 以 函数 D 是 连续 可 微 和 上 是 的。 由 于 D 的 一 阶 最 优 性 条 件 就 是 均衡 分 流 的 条 件 (定义 
11.3)， 因 此 更 的 局 部 最 小 值 就 对 应 一 个 均衡 分 流 。 因 为 更 连续 且 所 有 分 流 所 在 的 空 
间 是 紧 的 ， 所 以 @ 有 一 个 全 局 最 小 值 ， 且 这 个 最 小 值 对 应 的 分 流 也 是 一 个 均衡 分 流 。 
另外 ， 如 果 更 是 凸 函数 ， 就 意味 着 它 的 局 部 最 小 值 是 其 全 局 最 小 值 。 当 更 是 严格 的 
晤 函数 时 ，g 就 只 有 一 个 全 局 最 小 值 ， 因 此 也 就 只 有 一 个 均衡 分 流 。 当 GB 有 多 个 全 局 
最 小 值 时 ， 就 有 多 个 代价 相同 的 均衡 分 流 。 
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13.2.3 拥塞 博弈 


定理 13. 6 的 证 明 中 没 使 用 到 网 络 结构 的 信息 。 这 个 证 明 对 拥塞 博弈 依然 成 立 ， 
拥塞 博弈 中 有 一 个 关于 资源 (如 前 述 的 边 ) 的 抽象 集合 EE， 每 个 资源 本 身 存在 一 个 代价 
Kr, EAE REI i 都 有 一 个 可 以 自由 选择 的 策略 集 S; 守 2*( 如 前 述 的 oi-di 路 径 集 
合 )， 每 个 策略 都 是 一 个 资源 子 集 。 拥 塞 博弈 在 第 19 章 有 很 重要 的 作用 。 

定理 13. 6 的 证 明 不 需要 边 的 代价 函数 非 减 这 一 假设 。 第 15 章 的 内 容 将 告诉 我 
们 ， 定 理 13. 6 在 代价 函数 递减 的 网 络 中 的 一 般 化 很 有 用 。 


13.3 HF 


AE JE FF EH PHD 的 博弈 ， 势 博弈 有 一 个 性 质 ， 当 某 个 智能 体 偏 离 均 衡 时 ， 
势 函 数值 的 变化 等 于 偏离 者 自身 的 代价 变化 。 即 对 每 个 局 势 s， 智 能 体 守 及 其 单方 面 
策略 改变 s, € S;， 都 有 : 

DB(s! s) —B(s) = C,(s; ,si) —C,(s) (13. 9) 

直观 上 来 讲 ， 势 博弈 的 智能 体 都 在 无 意 间 共同 优化 6。 在 这 几 章 中 我 们 只 考虑 有 限 势 

定理 13. 6 的 证 明 中 的 等 价 式 (13.7) 表 明 : 所 有 单元 自私 路 由 博弈 ， 或 者 更 泛 化 
地 讲 ， 所 有 拥塞 博弈 都 是 势 博弈 。 第 14 和 15 章 中 会 有 更 多 例子 。 

定理 13. 6 证 明 的 最 后 一 段 意味 着 以 下 结论 成 立 。 

定理 13. 7( 势 博弈 中 PNE 的 存在 性 ) ”所 有 势 博弈 都 至 少 有 一 个 PNE。 

势 函 数 是 少 有 的 证 明 PNE 存在 性 的 通用 工具 之 一 。 


总 结 


© 许多 博弈 中 不 存在 纯 策 略 纳什 均衡 (PNE)， 这 促使 人 们 寻找 更 宽松 的 均衡 
概念 。 

© 所 有 有 限 博弈 都 一 定 存在 混合 策略 纳什 均衡 (MNE)， 混 合 策略 纳什 均衡 中 ， 
每 一 个 智能 体 都 独立 随机 地 选择 自己 的 策略 。 

e 相关 均衡 中 ， 一 个 信任 的 第 三 方 会 根据 一 个 公共 已 知 的 分 布 o 选择 一 个 局 势 s， 
任意 智能 体 i 在 获悉 so Fils, 后 ， 都 偏向 于 选择 策略 s; 而 不 是 任何 其 他 策略 5; 。 

e 不 像 MNE，CE 容易 计算 。 

o 粗糙 相关 均衡 (CCE) 是 相关 均衡 的 一 种 宽松 版 本 ， 粗 糙 相 关 均 衡 中 智能 体 的 单 
方面 策略 改变 与 s 无 关 。 

e 粗糙 相关 均衡 比 相关 均衡 更 容易 被 学 习 出 来 。 
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© 势 博弈 是 有 势 栅 数 的 博弈 ， 在 势 博弈 中 ， 某 个 智能 体 单 方面 改变 策略 导致 的 
势 函 数值 的 变化 ， 等 于 这 个 智能 体 自身 的 代价 变化 。 

© 所 有 势 博弈 都 至 少 有 一 个 PNE。 

© 所 有 单元 自私 路 由 博弈 都 是 势 博弈 。 


说 明 


Nash(1950) 证 明了 所 有 有 限 博弈 都 至 少 有 一 个 混合 策略 纳什 均衡 。 相 关 均 衡 的 
概念 来 自 Aumann(1974)。 粗 米 相 关 均 衡 在 Hannan(1957) 被 隐 含 地 提 到 ， 在 Moulin 
和 Vial(1978) 被 明确 地 提出 。 非 单元 自私 路 由 网 络 (13.2.2 节 ) 中 ,均衡 分 流 的 存在 
性 和 唯一 性 由 Beckmann 等 (1956) 证 明 。 定 理 13.6 和 拥塞 博弈 的 定义 来 自 Rosenthal 
(1973) 。 定 理 13. 7 和 势 博 弈 的 定义 来 自 Monderer 和 Shapley(1996) 。 

练习 13. 5 的 例子 来 自 Goemans 等 (2005) ， 练 习 13.6 来 自 Fotakis 等 (2005)。 问 
题 13. 1 由 Koutsoupias 和 Papadimitriou(1999 ) 讨 论 。 问 题 13.2 和 13.4 来 自 Mon- 
derer 和 Shapley(1996)， 问 题 13. 4 的 证 明 建 议 参考 Voorneveld 等 (1999) 。 问 题 13. 3 
来 自 Facchini 等 (1997) 。 


练习 


练习 13. 1 证 明代 价 最 小 化 博弈 中 ， 混 合 策略 纳什 均衡 就 是 ， 对 于 每 个 智能 体 ; 和 混 
合 策略 cf ， 都 满足 
Eral Cts] & Erta aa LOS] 
的 策略 组 合 cm os Oro 
练习 13.2 考虑 一 个 代价 最 小 化 博弈 ， 以 及 基于 博弈 局 势 的 联合 分 布 oo X… Kon, 
其 中 o; 是 智能 体 i 的 混合 策略 。 证 明 当 且 仅 当 m，…, oi 是 博弈 的 混合 
策略 纳什 均衡 时 ，c 是 博弈 的 一 个 相关 均衡 。 
练习 13. 3 证 明 对 于 代价 最 小 化 博弈 ， 局 势 S X…XS, 上 的 分 布 so 是 一 个 相关 均衡 ， 
当 且 仅 当 对 于 每 个 智能 体 i 和 交换 函数 6:S; 一 S;、 都 有 
E,..,(C;(s)] < E,_,[C, (8(s;) .s_,)] 
练习 13.4 (H) 考 虑 一 个 单元 自私 路 由 网 络 ， 其 中 每 条 边 。 的 代价 函数 为 仿 射 函数 
ce(X) 二 aex 十 b,， 且 a.，b. 宇 0。 令 C( 用 表示 分 流 f MAHI. 4), DA) 
表示 势 函 数 (13. 6)。 证 明 对 于 所 有 分 流 S WA 


SOP) < BN < CL) 


练习 13.5 在 带 权 单元 自私 路 由 网 络 中 ， 每 个 智能 体 ; 都 有 一 个 正 的 权重 w 并 会 选 


练习 13.6 


问题 


问题 13. 1 


问题 13. 2 


均衡 : 定义 、 示 例 和 存在 性 131 


择 将 自己 的 所 有 流量 分 配 到 一 条 oi-d; 路 径 上 。 考 虑 图 13. 3 的 网 络 ， 假 
设 存在 两 个 智能 体 权重 分 别 为 1 和 2， 他 们 的 起 点 为 o， 终点 为 4。 每 条 
边 有 它 的 代价 函数 ， 这 个 代价 函数 为 该 边 所 承载 的 总 流量 的 函数 。 举 个 
例子 ， 如 果 智 能 体 1 和 2 分 别 选 择 路 径 o>v>w>d 和 o 一 wd， 那 么 他 
们 传输 单位 交通 流 的 代价 分 别 为 48 和 74。 

证 明 ， 在 这 个 网 络 中 不 存在 纯 策略 纳什 均衡 分 流 。 


X+33 13x 


图 13.3 练习 13.5。 无 均衡 的 带 权 单元 自私 路 由 网 络 


考虑 带 权 单元 自私 路 由 网 络 ( 练 习 13. 5) 中 ， 每 条 边 的 代价 函数 为 仿 射 函 
数 。 利 用 势 函 数 


Of) = J (c.f F. + De. Cw; ws) 
eS, 


EE 


证 明 网 络 中 至 少 存在 一 个 ( 纯 策略 ) 均 衡 分 流 ， 其 中 S. 表示 在 分 流 了 中 使 
用 边 e 的 智能 体 集合 。 


CH) 回想 在 问题 12. 3 中 介绍 的 代价 最 小 化 博弈 ， 其 中 每 个 智能 体 ;一 1， 
2，…， 上 都 有 一 个 正 的 权重 w;， 且 从 m 个 相同 机 器 中 选择 一 台 机 器 来 最 
小 化 它 的 负载 。 我 们 仍然 考虑 以 最 小 化 工期 为 目标 ， 其 中 工期 定义 为 机 
器 上 的 最 大 负载 。 证 明 : 在 这 种 博弈 中 ， 当 &A Alm 趋 于 无 穷 时 ， 混 合 策 
略 纳 什 均衡 的 最 坏 情 况 POA( 式 (13.3)) 没 有 常数 上 界 。 
这 道 题 和 接 下 来 的 两 道 题 会 进一步 探索 势 博 弈 的 理论 (13. 3 节 )。 回 忆 一 
下 ， 势 函数 的 输入 是 博弈 的 局 势 。 对 于 任意 局 势 s， 任 意 智能 体 i 及 其 单 
方面 的 策略 改变 s; ， 势 函数 都 满足 : 

Bls! s=) —B(s) = Cils! s) — C (s) 
(a) 证 明 如 果 代 价 最 小 化 博弈 有 两 个 势 函 数 @ 和 到， 那么 对 于 这 个 博弈 
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问题 13. 3 


问题 13. 4 


的 每 个 局 势 s， 存 在 一 个 常数 bE 及 ， 使 得 D (s) =, (5) +d. 
Cb) 证 明 : 对 于 代价 最 小 化 博弈 ， 考 虑 两 个 局 势 s' A s RER RE iA j 

的 策略 处 不 同 。 如 果 对 于 所 有 这 样 的 s 和 对 ， 都 满足 下 式 : 

[C,¢s? sR) — C,¢s")] +00, (8? x — Ot 二 
CG, Gs 5829 — CG" 3) + FE) — Cea 88] 

MSR i A EE EE. FOR HE TK rH BY GE a 
(HH) 团 队 博 弈 是 代价 最 小 化 博弈 的 一 种 ， 在 团队 博弈 中 ， 对 于 每 个 局 势 
s， 所 有 智能 体 的 代价 都 相同 : C1(s) ==) TEREP, GAE 
能 体 的 代价 与 其 策略 无 关 : 对 于 每 个 s ;和 5s;，s; ES. MAC Cs, 
a 6). 
证 明 一 个 代价 最 小 化 博弈 (其 中 智能 体 的 代价 函数 为 C1 ，…，Ci) 是 一 个 
势 博弈 ， 当 目 仅 当 对 任意 i 和 ss， 都 有 

Ci(s) = Ci(s) + CD 

H Ci, es Cy 是 一 个 团队 博弈 ， Ci, oe, Ch 是 一 个 虚 博 弈 。 
13.2.3 节 定 义 了 拥塞 博弈 ， 并 表明 即使 代价 函数 不 是 非 递减 的 ， 所 有 的 
拥塞 博弈 都 是 势 博弈 。 这 道 题 要 证 明 其 逆 命 题 ， 每 个 势 博 弈 其 实 也 都 是 
一 个 “伪装 的 ”拥塞 博弈 。 如 果 两 个 博弈 G 和 9: 满足 以 下 条 件 ， 我们 
称 这 两 个 博弈 是 同 构 的 : (1) 两 个 博弈 智能 体 数目 相同 为 &; (2) 对 于 每 个 
智能 体 i?， 存 在 一 个 从 G IP i RES, 到 G 中 i 的 策略 集 T; 的 双 射 
fis (3) 对 于 每 个 智能 体 i 和 91 中 的 局 势 ss ，…，s，(2) 中 的 双 射 能 够 
保持 代价 不 变 ， 即 Cli es DSC a), es fe) GEP C 和 
C 分 别 为 智能 体 在 9 和 G 中 的 代价 函数 )。 
(a) CMER: 对 于 每 一 个 团队 博弈 ， 都 有 一 个 拥塞 博弈 与 其 同 构 。 
(b) (HEH: 对 于 每 一 个 虚 博 弈 ， 都 有 一 个 拥塞 博弈 与 其 同 构 。 
C) TER: 对 于 每 一 个 势 博弈 ， 都 有 一 个 拥塞 博弈 与 其 同 构 。 
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平滑 博弈 的 鲁 棒 无 秩序 代价 办 





前 一 章 介 绍 了 一 些 纯 策略 纳什 均衡 概念 的 宽松 版 本 。 将 均衡 集 扩 大 的 好 处 是 能 够 
增加 可 信 性 和 计算 可 行 性 ， 缺 点 是 无 秩序 界 只 会 随 着 均衡 集 的 扩大 而 变 差 。 本 章 介 绍 
“平滑 博弈 "， 在 平滑 博弈 中 PNE 的 POA 界 可 以 在 不 变 差 的 情况 下 ， 扩 展 到 一 些 宽松 
的 均衡 概念 下 ， 包 括 粗糙 相关 均衡 下 。 

14. 1 节 概 述 证 明 PNE 的 POA 界 的 “四 阶段 式 方法 ”， 这 个 方法 的 灵感 来 自 单 元 
自私 路 由 网 络 的 结论 。14. 2 节 介 绍 了 一 类 选 址 博弈 ， 并 使 用 四 阶段 式 方 法 证 明了 这 
种 博弈 PNE 的 POA 界 。14. 3 节 定 义 了 平滑 博弈 ，14.4 节 证 明了 这 类 博弈 的 POA 
界 可 以 扩展 到 几 个 PNE 的 宽松 版 本 下 。 


14. 1 POA 界 四 阶段 式 处 理 方法 


定理 12. 3 表明 对 于 代价 函数 为 仿 射 函数 的 单元 自私 路 由 网 络 ， 其 POA 至 多 为 
5/2。 回 顾 一 下 ， 该 定理 的 证 明 过 程 大 致 分 为 以 下 几 步 : 

1. 给 定 任意 纯 策略 纳什 均衡 ;， 我 们 对 每 一 个 智能 体 i 都 使 用 一 次 均衡 假设 ， 假 
设 如 果 i 的 策略 改变 为 8 且 最 优 局 势 为 9$”， 则 得 到 不 等 式 GOK ，s-;)。 需 
要 注意 的 是 ， 局 势 *' 与 纯 策略 纳什 均衡 s 是 什么 无 关 。 这 是 整个 证 明 过 程 中 唯一 使 
用 PNE 假设 的 地 方 。 

2. 将 智能 体 均衡 代价 界 的 & 个 不 等 式 加 和 和 。 不 等 式 (12. 9) 左 边 就 是 纯 策 略 纳什 
均衡 s 的 代价 ; 右边 则 是 一 个 s 和 8 "纠缠 在 一 起 的 函数 。 


3. 最 难 的 一 步 是 要 将 s 和 s* 纠缠 在 一 起 的 >) CC" 58.) 项 与 我 们 关心 的 两 个 量 (s 
M s 的 代价 ) 建 立 联系 。 不 等 式 (12.10) 证 明了 一 个 上 界 2 G6" ENGO T 


一 步 是 纯 代数 操作 ， 与 选择 哪 一 个 A s 分 别 作为 PNE 和 最 优 局 势 无 关 。 
4. 最 后 一 步 就 是 解 POA。 两 边 同时 减 去 二 Cs) HRE, MENT POA 


5 
至 多 是 于。 








这 个 证 明 很 经 典 ， 许 多 其 他 类 型 博弈 的 POA 证 明 都 可 以 遵循 同样 的 四 阶段 式 方 
法 。 本 章 的 关键 就 是 利用 这 个 处 理 方法 找到 一 些 “ 和 鲁 棒 ” 的 POA， 这 些 结果 适用 于 
第 13 章 中 定义 的 所 有 均衡 概念 。 


“14.2 选 址 博弈 
在 研究 一 般 理论 之 前 ， 我 们 再 举 一 个 实际 例子 。 


14.2.1 模型 


考虑 由 以 下 要 素 构成 的 选 址 博弈 : 

o 可 能 的 选 址 地 点 集合 上。 这 些 地 点 可 以 是 处 理 Web 缓存 的 服务 器 的 架设 地 点 ， 
或 是 一 家 面包 店 在 社区 里 的 开店 位 置 ， 等 等 。 

o 个 智能 体 的 集合 。 每 个 智能 体 i 从 集合 上 ;SL 中 选择 一 个 地 点 来 提供 服务 。 
所 有 智能 体 提供 相同 的 服务 ,不 同 的 只 是 在 哪 提供 。 对 于 一 个 智能 体能 够 提供 
服务 的 市 场 数量 没有 限制 。 

e 市 场 集合 M。 每 个 市 场 JE M 都 有 一 个 估 值 vw;， 这 个 估 值 是 市 场 愿意 为 使 用 智 

能 体 的 服务 支付 的 最 大 代价 ， 且 市 场 的 估 值 对 所 有 智能 体 都 是 已 知 的 。 

对 于 每 个 选 址 地 点 LEL 和 市 场 i€ M， 存 在 一 个 c;， 表 示 智 能 体 在 地 点 ! 对 j 

进行 服务 所 产生 的 代价 。 其 可 以 表示 为 物理 距离 ， 也 可 以 代表 两 种 技术 的 不 相 

容 程 度 ， 等 等 。 

给 定 每 个 智能 体 选 择 的 地 点 ， 每 个 智能 体 都 会 想方设法 以 尽 可 能 高 的 要 价 掌握 尽 

可 能 多 的 市 场 。 为 精确 定义 收益 ， 我 们 从 一 个 例子 开始 。 图 14. 1 展示 了 一 个 选 址 博 

F, HP L={l,. ls ls}, M={m, m}. RABTPSREAI 和 2， 其 中 二 = 人 04， 

请) 一 人 42， 。 所 有 市 场 的 佑 值 都 为 3。 到 每 个 市 场 的 代价 都 为 2。 到 市 场 

mys b 到 市 场 m 的 代价 都 为 1， 上 4、4 到 其 他 市 场 的 代价 都 为 无 穷 大 。 





图 14.1 有 两 个 智能 体 (1 和 2)， 三 个 选 址 地 点 (三 1410、 上 ，4)) 和 两 个 市 场 
(M=|{m > m )) 的 选 址 博弈 
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继续 分 析 这 个 例子 ， 假 设 第 一 个 智能 体 选择 地 点 h, BAE GE EFE ao 
那么 每 个 智能 体 都 是 他 们 所 进入 市 场 的 垄断 者 。 唯 一 能 限制 智能 体 要 价 的 就 是 市 场 愿 
意 支付 的 最 大 代价 。 因 此 每 个 智能 体 都 会 为 其 提供 的 服务 向 市 场 要 价 3。 这 种 情况 下 
服务 的 代价 为 1， 所 以 两 个 智能 体 的 收益 都 为 3 一 1==2，。 

换 一 种 情形 ， 现 在 假设 第 一 个 智能 体 选择 的 地 点 变 成 /;:， 第 二 个 智能 体 依 然 选 择 
地 点 l/s。 智能 体 1 依然 是 市 场 m 的 垄断 者 ， 因 此 依然 要 价 3。 但 是 他 的 代价 变 成 2 
了 ， 所 以 他 的 收益 降 到 了 1。 在 市 场 m;， 智能 体 2 不 能 不 考虑 任何 后 果 地 要 价 3 
了 一 一 因为 任何 高 于 2 的 要 价 都 会 使 得 智能 体 1 以 更 低 的 价格 获 利 从 而 占据 市 场 。 因 
此 ,智能 体 2 将 会 以 不 失去 市 场 的 最 高 价格 2 作为 要 价 。 由 于 智能 体 2 提供 服务 的 代 
价 为 1， 所 以 他 的 收益 为 2 一 1 一 1。 

给 定 选 址 博弈 的 一 个 策略 组 合 s， 其 中 了 为 选中 的 地 点 集合 且 智 能 体 i 选择 LE 
T. W REI i ATTI j EM 获得 的 收益 为 

wR cy Duy MHL 不 是 中 离 j 最 近 的 选 址 地 点 
mH ape a, 其 他 情况 
(14, 1) 

ds? (ER HEAR i 能 够 使 用 的 最 高 价格 ， 即 与 特定 代价 之 间 的 较 小 值 ， 其 中 特定 
代价 指 的 是 工 中 的 选 址 地 点 到 7 的 第 二 小 代价 。 式 (14. 1) 中 的 定义 假设 每 个 市 场 由 服务 
代价 最 低 的 潜在 供应 商 以 最 高 竞争 价格 提供 服务 。 所 以 收益 x (s) 就 是 智能 体 i 相对 于 
其 他 智能 体 在 市 场 ) 的 “竞争 优势 ”"， 其 最 多 为 y 减 去 服务 代价 。 

智能 体 i 的 总 共 收 益 为 


Ai(s) = Sx, (s) 


JEM 


选 址 博弈 属于 收益 最 大 化 博弈 (备注 13. 1) 。 
选 址 博弈 的 目标 函数 是 最 大 化 社会 福利 ， 对 于 策略 组 合 s 来 说 ， 其 被 定义 为 
W(s) = >) Cv, —dj(s)) (14. 2) 


其 中 d;(s) 是 vv 与 特定 代价 之 间 的 较 小 值 ， 特 定 代价 指 的 是 选 定 地 点 到 j 的 最 小 代 
价 。 定 义 (14.2) 假 设 ， 当 代价 至 少 是 v, 时 , 市场 j 不 选择 任何 地 点 ， 否则 由 选中 的 
地 点 以 最 小 代价 提供 服务 。 

福利 W(s) 和 策略 组 合 有 关 ， 两 者 之 间 的 关系 是 : 福利 仅仅 依赖 s 中 智能 体 选择 
的 选 址 地 点 集合 。 定 义 (14.2) 对 于 被 选中 的 地 点 集合 T 的 任意 子 集 来 说 也 是 说 得 通 
的 ， 这 种 情况 下 我 们 有 时 将 其 写作 W(7T)。 

每 个 选 址 博弈 都 至 少 存在 一 个 PNE( 练 习 14. 1)。 接 下 来 ,我 们 要 证 明 任 意 选 址 
博弈 的 任意 PNE 下 的 社会 福利 都 至 少 是 最 大 可 能 值 的 50%。。 





蝗 ” 当 目标 是 最 大 化 某 项 指标 时 ，POA 总 是 至 多 为 1，POA 越 接近 1 越 好 。 
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定理 14. 1( 选 址 博弈 的 POA R) 任意 选 址 博弈 的 POA 至 少 是 1/2。 
在 最 坏 情 况 下 POA 的 界 为 1/2( 练 习 14. 2) 。 


14.2.2 选 址 博弈 的 性 质 


接 下 来 ， 我 们 要 给 出 任意 选 址 博弈 都 有 的 三 个 性 质 ， 并 且 定 理 14. 1 的 证 明 只 依 
赖 于 这 些 性 质 。 


(Pl) 对 于 任意 策略 组 合 s， 智 能 体 收益 之 和 》)xi(s) 至 多 等 于 社会 福利 W(s)。 


这 个 性 质 来 自 于 以 下 两 个 事实 : 每 个 市 场 ICM 都 会 使 社会 福利 增加 
v; 一 d;(s)， 但 使 距离 最 近 的 选 址 地 点 收益 增加 dj”(s) 一 dj (s); 根据 定义 
Ad (s)<u;. 
(P2) WFR RIBAG so 2 (s)=W(s)—W(s_,), BIE AE AR AY aoe A Ah Pr E 
地 点 带 来 的 额外 福利 。 
为 了 解 这 个 性 质 ， 把 W(s) 一 W(s_;) 中 市 场 j 所 起 作用 的 部 分 写作 min{v,, 
dj(s_7)} 一 min{v;，dj(s)}。 当 v; 不 起 作用 时 ， 这 其 实 就 是 ;中 到 j 的 最 近 
位 置 比 s_; 中 到 j 的 最 近 位 力 要 更 接近 的 程度 。 除 非 智 能 体 i 所 在 的 地 点 就 
是 s 中 到 j 最 近 的 地 点 ,否则 的 话 这 个 值 都 是 0。 不 为 0 的 情况 下 ， 其 表达 
式 为 
min{v, sdi” (s)} — min{w;,d;(s)} (14. 3) 
不 管 怎样 ， 这 都 精确 地 表示 了 在 s 下 ,市 场 j 在 智能 体 i 的 收益 里 的 作用 部 
分 zx; (s)。 对 所 有 jEM， 把 式 (14. 3) 加 起 来 就 可 证 明 这 个 性 质 。 
(P3) 作为 选 定 地 点 集合 的 函数 ， 社 会 福利 W 满足 单调 性 和 次 模特 性 。 单 调 性 意 
REM TETEL Ht, WOT, )SWCT,); 这 个 性 质 从 式 (14. 2) 来 看 是 显 而 
易 见 的 。 次 模特 性 是 收益 递减 的 集合 论 版 本 ， 正 式 定 义 为 ， 对 于 任意 地 点 
LEL AMAA T,CT,CL(A 14.2), & 
W(T, U {@}) —WCT.) <WCT, U (¢}) — WT) (14. 4) 








图 14.2 次 模特 性 的 定义 。 向 一 个 大 集合 To 加 一 个 1 产生 的 社会 福利 增 
量 ， 小 于 向 一 个 小 集合 T 加 一 个 1 产生 的 社会 福利 增 量 
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这 个 性 质 来 自 式 (14. 3) 一 一 新 增 一 个 地 点 ! 所 增加 的 福利 ; 练习 14. 3 要 求 
证 明 其 相关 细节 。 


14.2.3 定理 14. 1 的 证 明 


我 们 按照 14. 1 节 的 四 阶段 式 方法 。 令 s 表示 任意 一 个 PNE，s* 表示 最 大 化 社会 
福利 的 局 势 。 第 一 步 ， 假 定 智能 体 单方 面 改变 策略 后 选择 的 局 势 是 s" ， 这 样 对 每 个 
智能 体 使 用 一 次 PNE 假设 。 即 由 于 s 是 PNE， 对 于 每 个 智能 体 i A 

mils) D mils ssa) (14.5) 
这 是 证 明 过 程 中 唯一 一 次 假设 s 是 PNE。 
第 二 步 对 所 有 智能 体 将 式 (14. 5) 进 行 加 和 ， 得 到 


k k 
Ws) > D mls) > Dd) mils osa) (14. 6) 
i=l i=} 


这 里 第 一 个 不 等 号 来 自选 址 博弈 的 性 质 (P1) 。 
第 三 步 是 将 式 (14.6) 的 最 后 一 项 纠缠 项 拆 解 开 ， 并 与 我 们 关心 的 两 个 量 (W(s) 和 
W(s* )) 联 系 起 来 ,根据 选 址 博弈 的 性 质 (P2)， 有 


k k 
Dils ssa) = DW 6s; ssa) — Ws i)] (14.7) 
i=] r=1 


为 了 使 上 式 右边 变 成 可 缩放 的 和 的 形式 ?， 向 第 i 项 加 入 额外 的 地 点 ss ee sao 
根据 W 的 次 模特 性 (性 质 (P3))， 对 于 i 二 1，2,，…, k, Æ 

Ws; ssa) —W(s_;) > Ws! ,ess os) — Ws? se ss 58) 
因此 ， 式 (14.7) 的 右边 的 下 界 为 


k 


SI [WCG COS i$) — Wits; ot ei 08) 


由 此 ， 式 (14.7) 化 简 为 
了 
其 中 不 等 号 由 W 的 单调 性 (性 质 (P3)) 得 到 。 总 结 一 下 ， 有 


k 
Dl ssa) >Wie) — Ws) (14. 8) 
i=l 


这 就 完成 了 证 明 的 第 三 步 。 
第 四 步 ， 也 是 最 后 一 步 就 是 解 POA。 由 不 等 式 (14.6) 和 (14. 8) 可 以 得 到 
W(s) > W(s* ) —W(s) 
所 以 





O sHs 中 某 些 地 点 可 能 会 重合 ,但 这 并 不 影响 证 明 。 
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所 以 POA 至 少 是 1/2。 至 此 ， 定 理 14. 1 的 证 明 就 完成 了 。 


* 14.3 平滑 博弈 


接 下 来 的 定义 是 单元 自私 路 由 博弈 (定理 12. D 和 选 址 博弈 (定理 14. 1) 中 POA 界 
的 证 明 过 程 中 第 三 步 “ 拆 解 ”的 抽象 版 本 。 我 们 的 目标 不 单单 是 为 了 泛 化 ; 某 种 意义 
E. 通过 这 个 条 件 建立 起 的 POA 可 以 很 自然 地 满足 鲁 棒 性 。 

定义 14. 2( FREF) 

(a) 若 对 于 所 有 策略 组 合 s，s”， 有 

DIC ss) SA costs” ) +p + cost(s) (14. 9) 

则 称 代价 最 小 化 博弈 是 (AM，/j)- 平 滑 的 。 这 里 cost(") 是 一 类 满足 以 下 性 质 的 目标 函 
数 ， 对 于 每 个 策略 组 合 sS， 有 cost(s) << HC ls). 

b) 车 对 于 所 有 策略 组 合 s，s"， 有 


k 


Smr ssa) EA Wape Ws) (14. 10) 
i=} 
则 称 收益 最 大 化 博弈 是 (1，1)- 平 滑 的 。 这 里 了 网 (*) 是 一 类 满足 以 下 性 质 的 目标 函数 : 
k 
对 于 每 个 策略 组 合 s， 有 W(s) > Jlro). 


只 要 选择 合适 的 4 和 jy， 每 个 博弈 都 可 以 是 (4， OF. (AER YAH POA R 
BORA 和 jw 不 能 太 大 ( 见 14.4 节 )。 

平滑 性 质 控 制 了 局 势 中 一 组 “一 维 扰动 ”的 影响 ， 这 些 影响 是 初始 局 势 s 和 扰动 
s` 的 函数 。 直 观 解释 的 话 ， 就 是 在 4 和 jy 值 较 小 的 (\，w) -平滑 博弈 中 ， 单 个 智能 体 
对 其 他 智能 体 造 成 的 外 部 性 是 有 界 的 。 


单元 自私 路 由 网 络 是 ( 字 ， 读 )- 平 滑 的 代价 最 小 化 博弈 。 其 依据 来 源 于 我 们 的 证 
明 : 式 (12.6) 的 右 项 的 上 界 由 式 (12. 10) 的 右 项 给 出 ， 并 且 目 标 函 数 (11. 3) 选 择 的 界 
cost(s) = >)Ci(s) 。 选 址 博弈 是 (1，1)- 平 滑 博 弈 ， 其 依据 是 14. 2. 2 节 的 性 质 (P1) 


和 不 等 式 (14. 8). © 
备注 14. 3( 关 于 策略 组 合 平滑 ) 在 一 个 博弈 中 ， 如 果 不 等 式 (14.9) 或 者 (14. 10) 
对 某 个 特定 的 策略 组 合 s" 和 任意 策略 组 合 s 都 成 立 ， 那 么 这 个 博弈 就 是 关于 策略 组 





O 在 证 明 单元 自私 路 由 和 选 址 博弈 中 “ 拆 解 ” 不 等 式 这 一 步骤 时 ， 需 要 注意 和 8 分 别 是 PNE 和 最 优 
局 势 . 在 14. 2.2 节 中 , 我 们 的 证 明 没 有 用 到 这 一 点 ， 但 我 们 使 用 了 更 泛 化 的 方法 ， 对 任意 两 组 局 势 
进行 了 对 比 。 


平滑 壕 蛮 的 章 梭 无 秩 夯 代价 界 139 








As (MA，1)- 平 滑 的 。 所 有 关于 定义 14.2 的 结论 ， 包 括 14.4 节 的 内 容 ， 仅 要 求 关 于 
某 个 最 优 局 势 s$ "平滑 就 足够 了 。 问 题 14. 1 一 14. 3 中 有 关于 这 个 宽松 条 件 的 应 用 。 


14.4 平滑 博弈 的 鲁 棒 POAR 


本 节 将 表明 平滑 博弈 的 POA 界 可 以 应 用 在 PNE 的 一 些 宽松 版 本 上 。 总 的 来 说 ， 
某 种 均衡 的 POA 被 定义 为 一 个 比值 式 (13. 3)， 只 需要 将 分 子 中 的 “MNE” 换 成 现在 
的 均衡 概念 即 可 。 

14.4.1 PNE 的 POA 界 

在 p<1 的 代价 最 小 化 (4，p) -平滑 博弈 中 ， 每 个 纯 策略 纳什 均衡 的 代价 至 多 是 
最 优 局 势 s* 的 [一 倍 。 为 了 证 明 这 一 点 ， 先 假设 目标 函数 满足 costs) < DCCs) ， 
再 对 每 个 智能 体 使 用 一 次 PNE 条 件 ， 最 后 结合 平滑 性 的 定义 就 可 以 得 到 


k 
cost(s)< >) C(s) 
i=l 


< Wes „S=;) 
< Aà » cost(s” ) + p cost(s) 
RA, BIHIR. 
类 似 的 ， 在 收益 最 大 化 4，j) -平滑 博弈 中 ， 目 标 函 数值 在 任意 一 个 PNE 下 都 至 
少 是 最 优 局 势 的 [4- 倍 。 以 上 结果 扩展 了 我 们 在 单元 自私 路 由 网 络 和 选 址 博 讲 中 关 


F POA 界 的 结论 。 回 忆 在 仿 射 代价 函数 的 单元 自私 路 由 网 络 中 POA 界 为 5/2， 在 选 
址 博弈 中 POA 界 为 1/2。 





14.4.2 CCE 的 POA 界 


接 下 来 ， 我 们 初步 尝试 理解 : 对 于 (4，1)- 平 滑 博 弈 来 说 ，POA RA 





I 或 者 
计 二 是 鲁 样 的， 这 个 结果 适用 于 博 赛 的 所 有 粗糙 相关 均衡 (CCE， 见 定义 (13. 5). 

定理 14. 4( 平 滑 博 弈 中 CCE 的 POA) AMA pol 的 代价 最 小 化 (1，H)- 平 滑 博 
RP, CCE 的 POA 至多 是 J 入。 


也 就 是 说 ， 我 们 在 上 一 节 得 到 的 PNE 的 POA 界 对 所 有 CCE 来 说 同样 成 立 。 
此 ， 在 平滑 博弈 中 ，CCE 是 极其 有 效 的 均衡 概念 一 足够 宽松 ， 因 为 它 很 容易 计算 
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( 见 第 17 章 )， 但 同时 又 足够 严格 ， 因 为 它 能 够 保证 良好 的 最 坏 情 况 界 。 

给 定 这 些 定义 后 ， 我 们 赁 着 直觉 就 能 证 明定 理 14. 4。 

定理 14. 4 的 证 明 : 考虑 代价 最 小 化 (4，4)- 平 滑 博弈 ， 粗 烽 相 关 均 衡 o 和 最 优 局 
Ws’, RHA 


k 
E,.,[eost(s)I< E| JJC% | (14.11) 
1 一 1 
k 
= SE... [Cts] (14. 12) 
i=] 
k 
< Sg a (14. 13) 
i=] 
k 
= Bs| DE e| (14. 14) 
i=1 
< E,_,[A + cost(s* ) +p + cost(s) | (14. 15) 
= à + cost(s* ) +p + E,.,[cost(s)] (14. 16) 


其 中 不 等 式 (14. 11) 来 自在 对 目标 函数 的 基本 假设 ， 等 式 (14. 12), C14. 14) 和 (14. 16) 
来 自 期 望 的 线性 性 质 ， 不 等 式 (14. 13) 来 自 粗 糙 相 关 均 衡 的 定义 (13. 5)( 对 每 个 智能 体 
i 都 应 用 一 次 ， 假 设 智能 体 单方 面 策略 改变 为 5 )， 不 等 式 (14. 15) 来 自 (，7) -平滑 
性 。 最 后 移 项 就 可 以 完成 证 明了 。 = 


类 似 的 ， 在 收益 最 大 化 (1，7)- 平 滑 博弈 中 ，POA 界 j 和 适用 于 所 有 CCE( 见 练 


习 14.4), 

对 于 单元 自私 路 由 博弈 (定理 12. 3) 和 选 址 博弈 (定理 14.1), 我们 得 到 的 5/2 和 
1/2 的 POA 界 起 初 看 起 来 好 像 是 针对 PNE 的 ， 但 是 由 于 在 以 上 证 明 过 程 中 ,我 们 建 
立 了 更 强 的 平滑 性 条 件 ( 定 义 14. 2)， 定理 14. 4 意味 着 5/2 和 1/2 其 实 对 于 所 有 CCE 
都 成 立 。 


14.4.3 近似 PNE 的 POA 界 


平滑 博弈 还 有 很 多 其 他 优美 的 性 质 。 比 如 ，(A，/j -平滑 博弈 的 POA 界 





[全 -或 者 
u 
I 个 能 很 自然 地 适用 于 近似 均衡 ， 这 个 界 会 随 着 近似 参数 的 变化 温和 地 变 差 。 

定义 14. 5(s- 纯 策略 纳什 均衡 ) 对 于 e 宇 90， 如 果 对 于 任意 智能 体 i 及 其 策略 改变 
s',€S;, 都 有 

Ci(s) < (1 +e) » C;Cs; s=) (14.17) 

那么 代价 最 小 化 博弈 的 局 势 s 被 称 为 一 个 e- 纯 策略 纳什 均衡 (e-PNE)。 

也 就 是 说 ， 在 一 个 ePNE 中 ,没有 任何 智能 体 可 以 通过 单方 面 改变 策略 来 使 其 
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代价 降 到 原来 的 -二 以下。 以 下 结论 是 关于 近似 均衡 的 POA 界 (练习 14.5)。 
定理 14. 6( 平 滑 博弈 s-PNE BY POA) AMA pol 的 代价 最 小 化 (A4， ji)- 平 滑 博 
FP, APEE e<l, e-PNE 的 POA 至 多 为 


(1 十 e)A 
1 一 AI 十 6) 
类 似 的 结果 对 收益 最 大 化 (4，j)- 平 滑 博弈 ， 以 及 其 他 均衡 概念 的 近似 版 本 同样 
适用 。 
比如 ， 在 代价 函数 为 仿 射 函数 的 单元 自私 路 由 网 络 中 ， 其 本 身 是 { R 


5 二 下， 其 中 e<2。 


的 ， 这 类 博弈 的 ePNE 的 POA BARS, | 





总 结 


o 证 明 POA 界 的 四 阶段 式 方法 是 : (1) 对 于 每 一 个 智能 体 都 调用 一 次 均衡 假设 ， 
假设 智能 体 使 用 最 优 局 势 中 的 策略 偏离 均衡 ， 从 而 找 出 所 有 智能 体 在 均衡 下 
的 代价 的 界 ; (2) 将 得 到 的 不 等 式 加 和 得 到 总 的 均衡 代价 ; (3) 将 纠缠 的 界 和 
均衡 代价 及 最 优 代 价 联系 起 来 ; (4) 解 POA, 

@ 带 仿 射 代价 函数 的 单元 自私 路 由 网 络 的 POA 界 可 以 通过 以 上 四 阶段 式 方法 得 到 。 

e 选 址 博弈 中 ， 智 能 体 选 择 提供 服务 的 地 点 ， 并 对 一 些 市 场 进行 竞争 。 通 过 四 
阶段 式 方法 得 到 选 址 博弈 的 POA 至少 是 1/2, 

o 平滑 博弈 的 定义 其 实 就 是 四 阶段 式 方法 中 “ 拆 解 ”步骤 的 抽象 化 。 

o 由 平滑 性 质 得 到 的 POA 界 能 扩展 到 所 有 粗糙 相关 均衡 。 

e 由 平滑 性 质 得 到 的 POA 界 能 扩展 到 所 有 近似 均衡 ， 且 这 个 界 随 着 近似 参数 温 
和 地 退化 。 


说 明 


选 址 博弈 的 定义 和 定理 14. 1 来 自 Vetta(2002)。 适 用 于 纳什 均衡 以 外 的 POA 界 的 
重要 性 在 Mirrokni 和 Vetta(2004) 中 进行 了 刻画 。CCE 的 POA 由 Blum 等 (2008) 首 先 研 
究 。 定 义 14.2、 定 理 14. 4 和 定理 14. 6 来 自 Roughgarden(2015) 。 使 用 术语 “平滑 ”的 
目的 是 简明 扼要 地 建立 定义 14. 2 与 Lipschitz 条 件 的 相似 关系 。 问 题 14. 1 一 14. 3 分 别 来 
自 Hoeksma 和 Uetz(2011), Caragiannis 等 (2015)， 以 及 Christodoulou 等 (2008) 。 更 多 
关于 ( 非 DSIC) 拍 卖 和 机 制 的 POA 请 参见 Roughgarden 等 (2016) 的 综述 。 
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练习 


练习 14. 1 


练习 14. 2 
练习 14. 3 


练习 14. 4 


练习 14.5 


问题 


问题 14. 1 


问题 14. 2 


(H) 证 明 每 个 选 址 博弈 都 是 一 个 势 博弈 (13. 3 节 )， 因 此 每 个 选 址 博弈 至 
少 有 一 个 了 NE。 

证 明定 理 14. 1 是 紧凑 的 ， 即 存在 一 个 选 址 博弈 ， 其 PNE 的 POA 是 1/2。 
证 明 选 址 博弈 的 社会 福利 函数 是 选 定 地 点 的 次 模 函 数 。 


证 明 (4，/)- 平 滑 的 收益 最 大 化 博弈 中 ，CCE 的 POA EDAT 
CH) iE AA ae BE 14. 6. 


这 道 题 研究 以 下 情境 : & 个 智能 体 ， 其 中 智能 体 7 有 一 个 处 理 时 间 pje AF 
在 痉 台 相同 的 机 器 。 每 个 智能 体 选 择 一 台 机 器 ， 每 台 机 器 上 的 智能 体 按 
处 理 时 间 由 短 到 长 使 用 机 器 。( 你 可 以 假设 处 理 时 间 互 不 相同 ) 比 如 ， 如 
果 处 理 时 间 为 1、3 和 5 的 智能 体 计 划 使 用 同一 台 机 器 ， 那 么 他 们 的 完成 
时 间 分 别 是 1、4 和 9。 接 下 来 的 问题 考虑 代价 最 小 化 博弈 ， 其 中 智能 体 
要 通过 选择 合适 的 机 器 最 小 化 他 们 的 完成 时 间 ， 博 弈 的 目标 函数 是 最 小 


化 所 有 智能 体 完 成 时 间 之 和 之 es 


Ca) 将 智能 体 j 的 顺 位 R; 定义 为 计划 使 用 与 j 同一 台 机 器 且 处 理 时 间 至 
少 是 p; 的 智能 体 人 数 ， 包括 j 本 身 。 比 如 ， 如 果 处 理 时 间 为 1、3 和 
5 的 智能 体 计划 使 用 同一 台 机 器 ， 那 么 他 们 的 顺 位 分 别 就 是 3、2 
和 1。 
证 明 局 势 的 目标 函数 值 ye 可 以 写成 Ver, o 

(b) 证 明 以 下 算法 可 以 产生 一 个 最 优 局 势 ， CD) 将 智能 体 从 大 到 小 排序 ; 
(2) 对 7 王 1，2，…，R&， 按 顺序 将 第 7 个 智能 体 分 配 到 第 ) mod m A 
机 器 上 (其 中 第 0 台 机 器 即 第 m 台 机 器 ) 。 

Cc) CH) 证 明 在 所 有 这 样 的 调度 博弈 中 ，CCE 的 POA 最 多 为 2。 

在 问题 3. 1 描述 的 广义 二 价 关键 字 搜 索 拍 卖 可 以 导出 一 个 收益 最 大 化 博 

弈 ， 其 中 竞拍 者 ;目标 是 最 大 化 他 的 效用 ayn (vi 一 px )，wi 为 他 的 单 次 

点 击 估 值 ，j (为 他 被 分 配 的 位 置 ，pjw 和 ut 为 单 次 点 击 价格 和 所 在 位 

置 点 击 率 。( 如 果 i 没有 被 分 配 位 置 ， 则 ao 二 pi 二 0,) 
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问题 14. 3 





(a) 假设 每 个 竞拍 者 可 以 竞价 任意 非 负数 。 证 明 即 使 只 有 一 个 位 置 和 两 个 
竞拍 者 ，PNE 的 POA 也 可 以 为 0。 

(b) (HH) 现在 假设 每 个 竞拍 者 的 竞价 总 是 0 到 vw; 之 间 的 数字 。 证明 CCE 
的 POA 至 少 是 1/4。 

这 道 题 考虑 组 合拍 卖 ( 例 7.2)， 其 中 每 个 竞拍 者 i 有 一 个 单位 需求 估 值 v, 

(练习 7.5)。 这 意味 着 对 于 vn，…，w,， 以 及 物品 子 集 S， 有 v(S)= 

MAR Bye 

考虑 一 个 收益 最 大 化 博弈 ， 其 中 每 个 竞拍 者 i 对 每 个 物品 j 竞价 5; ， 每 

个 物品 利用 单 物 品 二 价 拍卖 分 开 售 卖 。 同 问题 14. 2(b) 类 似 ， 假 设 每 个 竞 

M by EF O 和 wi 之 间 。 竞 拍 者 的 效用 为 他 对 物品 的 估 值 减 去 他 的 总 支 

付 。 比 如 ， 如 果 竞 拍 者 i 对 两 个 物品 的 估 值 为 vi 和 vw， 当 次 高 竞价 为 pi 

和 p: 时 ， 他 同时 赢得 两 个 物品 ， 那 么 他 的 效用 就 为 max {vn，wviz} 一 

(pit po). 

(a)〈H) 证 明 在 这 样 一 个 博弈 中 ，PNE 的 POA 至 多 为 1/2。 

(b)〈H) 证 明 在 这 样 一 个 博弈 中 ，CCE 的 POA 至 少 为 1/2。 
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本 章 有 两 个 目标 。 一 是 介绍 一 个 简单 的 网 络 生成 模型 。 这 个 模型 和 单元 自私 路 由 
i BANETA 
他 智能 体 。 此 类 博弈 一 般 都 含有 多 个 PNE， 并 且 这 些 均衡 的 代价 也 多 种 多 样 。 第 二 
个 目标 是 聚焦 于 一 类 “合理 的 ”PNE 子 集 ， 并 介绍 两 个 相应 的 方法 。 在 理想 情况 下 ， 
与 所 有 PNE 相 比 ， 此 类 子 集 应 具有 更 好 的 最 坏 情 况 近 似 界 。 我 们 也 会 给 出 一 个 合理 
解释 以 说 明 为 什么 此 类 子 集 比 其 他 均衡 更 值得 研究 。 

15. 1 节 定 义 网 络 代价 分 摊 博 弈 并 且 研 究 两 个 重要 的 示例 。15. 2 节 证 明 网 络 代价 
分 摊 博 弈 中 最 好 情况 PNE 的 近似 界 。15. 3 节 和 15. 4 节 证 明 强 纳什 均衡 的 POA 界 。 
强 纳什 均衡 是 PNE 的 一 个 子 集 ， 在 强 纳什 均衡 下 ， 没 有 任何 智能 体 联 盟 可 以 通过 偶 
离 该 均衡 而 获 益 。 


15.1 网 络 代价 分 摊 博 弈 


15. 1.1 外 部 性 


接 下 来 介绍 的 网 络 生成 模型 是 具有 正 外 部 性 的 博弈 的 一 个 具体 实例 。 博 弈 中 智能 
体 产 生 的 外 部 性 是 指 该 智能 体 的 目标 函数 值 与 其 对 集体 目标 函数 值 做 的 贡献 之 差 。 前 
几 章 中 研究 的 模型 都 是 含有 负 的 外 部 性 的 ， 也 就 是 说 ,智能 体 并 不 会 完全 承担 他 们 造 
成 的 损失 。 比 如 在 路 由 博弈 里 ， 一 个 智能 体 不 会 考虑 他 的 出 现 对 别 的 智能 体 ( 这 些 别 
的 智能 体 使 用 其 路 径 里 的 边 ) 所 造成 的 额外 代价 。 

此 外 也 有 一 些 重要 的 具有 正 的 外 部 性 的 场景 。 比 如 你 经 常会 加 入 某 个 校园 组 织 或 
社交 网 络 ， 以 便于 谋 得 个 人 利益 。 同 时 ， 你 的 出 现 也 丰富 了 组 内 的 其 他 成 员 的 体验 。 
作为 一 个 智能 体 ， 你 一 般 不 喜欢 带 有 负 外 部 性 的 新 成 员 出 现在 博弈 里 ， 但 是 正 外 部 性 
的 新 成 员 则 会 让 你 很 高 兴 。 


15. 1.2 模型 
网 络 代 价 分 摊 博 弈 (network cost-sharing game) 产 生 在 图 G=(V, E)E. KAA 
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以 是 有 向 图 或 无 向 图 ， 并 且 每 条 边 CCE 都 有 一 个 固定 的 代价 7. 宇 9。 图 中 共有 上 个 智 
能 体 ， 每 个 智能 体 i 都 有 一 个 源 点 0; EV 和 一 个 终点 d;EV，i 的 策略 集 为 图 中 所 有 
ord: 路 径 。 此 博弈 的 局 势 是 一 个 路 径 向 量 P 二 (P!，…，P), 语义 上 ， 它 表示 生成 


的 子 网 络 Vv. UP). 


我 们 把 y 看 成 构建 边 e 的 代价 ， 比 如 铺设 高 速 网 络 光纤 的 代价 。 这 个 代价 与 使 
用 此 边 的 智能 体 的 数目 无 关 。 智 能 体 的 代价 则 由 路 径 中 的 每 条 边 来 定义 ， 这 与 路 由 博 
弈 中 一 样 ( 见 第 11、12 章 ) 。 如 果 多 个 智能 体 在 的 路 径 中 都 有 边 e， 那 么 他 们 应 当 分 担 
此 边 的 固定 总 代价 y, (假设 为 平均 分 摊 )。 借 用 代价 最 小 化 博弈 (第 13 章 ) 来 讲 ， 智 能 
体 i 在 局 势 P 下 的 代价 Ci(P) 为 


ChP) = 2 (15. 1) 
Af. 


其 中 fS |i: eE Po | 表示 其 路 径 中 包含 边 。 的 智能 体 的 数目 。 目 标 函 数 为 最 小 化 
所 生成 网 络 的 总 代价 : 
cos(P) = >) y (15. 2) 


e€E:f 21 


与 路 由 博弈 里 的 目标 函数 (11. DAL DAM, RAAS. 2) 也 可 以 写成 所 有 智能 
体 的 代价 和 >) C(P)， 


15.1.3 示例 : VHS 还 是 Betamax 


首先 让 我 们 通过 几 个 直观 的 例子 来 理解 网 络 代价 分 推 博弈。 第 一 个 例子 说 明了 带 
有 正 外 部 性 的 博弈 有 可 能 会 发 生 严重 的 不 协同 问题 。 

考虑 如 图 15. 1 里 的 简单 例子 ， 有 上 个 智能 体 ， 
他 们 共享 一 个 源 点 。 和 终点 4。 可 以 将 这 个 例子 看 =a 
作 在 两 个 相互 竞争 的 产品 技术 中 做 选择 。 例 如 在。 C) (a) 
20 世纪 80 年 代 ， 有 两 种 新 兴 技 术 用 于 电影 租赁 。 Eee 
技术 极 客 认为 Betamax 更 好 ， 他 们 对 应 于 图 15. 1 
中 的 代价 较 小 的 边 。VHS 是 另 一 项 技术 ， 其 在 时 


ig 


k 


图 15.1 VHS 还 是 Betamax, 一 


个 网 络 代价 分 摊 博 弈 里 
期 占据 了 大 部 分 的 市 场 份额 。 由 于 消费 者 在 选择 技 的 POA 可 以 和 网 络 中 的 
t25 选择 一 智能 体 个 数 & 一 样 大 。 
术 时 会 与 大 多 数 其 他 人 选择 一 致 ，Betamax 虽 技 术 e8c>0 TELE 
更 好 ， 但 这 并 不 能 弥补 市 场 占 有 率 上 的 劣势 ， 因 此 
最 终 慢 慢 被 市 场 淘汰 了 。 


在 图 15. 1 中 ， 所 有 智能 体 都 选择 上 面 那 条 边 是 最 优 局 势 ， 此 时 总 的 代价 为 1 十 e。 
这 个 策略 也 是 一 个 PNE( 定 义 13.2)。 但 遗憾 的 是 ， 网 络 中 还 存在 第 二 个 PNE， 即 所 
有 智能 体 都 选择 下 面 那 条 边 。 由 于 代价 & 被 平均 分 扒 ， 每 个 智能 体 的 支付 是 1]。 如 果 
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一 个 智能 体 单 方面 把 策略 改变 到 上 面 那 条 边 ， 他 会 支付 那 条 边 上 的 全 部 代价 1 十 s， 
这 是 一 个 更 高 的 代价 。 这 个 例子 表明 ， 网 络 代价 分 摊 博 弈 中 的 POA 可 以 和 智能 体 的 
数目 一 样 高 。 练 习 15. 1 证 明了 与 此 对 应 的 POA 的 上 界 。 

上 述 VHS 还 是 Betamax 的 例子 很 棘手 。 本 来 我 们 给 出 了 一 个 带 有 外 部 性 的 合理 
的 网 络 模型 ， 然 而 那 已 经 帮助 我 们 推演 了 几 个 模型 的 POA 在 一 个 极端 的 均衡 上 变 得 
很 差 ， 给 不 了 任何 有 用 的 信息 。 那 么 ， 如 果 我 们 只 关注 于 一 些 “ 好 的 ”均衡 ， 情 况 会 
怎么 样 呢 ? 下面， 我 们 先 讨论 男 一 个 重要 的 例子 ， 然 后 再 回 到 这 个 问题 上 来 。 


15.1.4 示例 : 退出 博弈 


考虑 如 图 15. 2 中 的 网 络 代价 分 摊 博 弈 。A 个 智能 体 有 k 个 不 同 的 源 点 01，… 
oi:， 但 是 有 相同 的 终点 4。 他 们 可 以 选择 首先 在 集结 地 wv 汇合， 然后 再 共同 去 dd, A 
的 代价 为 1 十 e。 每 个 智能 体 也 可 以 “选择 退出 *”， 即 单独 地 直接 沿 着 od 这 条 路 走 。 
当 智 能 体 i 选择 退出 策略 时 ,他 的 代价 为 1/i。 





图 15.2 退出 博弈 。 这 个 博弈 存在 一 个 唯一 的 PNE， 其 代价 为 最 优 局 势 的 Ki 倍 。 
参数 可 以 任意 小 


最 优 局 势 一 目 了 然 : 如 果 所 有 智能 体 都 途径 集结 点 ， 那 么 总 的 代价 为 1 十 e。 遗 
憾 的 是 ， 这 不 是 一 个 PNE: 智能 体 & 可 以 通过 选择 退出 策略 来 略微 降低 他 的 支付 ， 
这 对 他 来 说 是 一 个 占 优 策略 。 鉴 于 智能 体 & 在 一 个 PNE 中 没有 使 用 集结 点 ， 智 能 体 
k 一 1 同样 也 不 会 使 用 。 因 为 当 智能 体 & 不 参与 时 ，k 一 1 将 会 支付 至 少 1+e/(k 一 1), 但 
他 选择 退出 策略 是 占 优 的 。 重 复 此 过 程 可 知 ， 不 存在 任何 一 个 有 智能 体 通过 节点 v 的 均 
衡 。 而 所 有 智能 体 选择 退出 是 一 个 PNE， 并 且 这 个 唯一 的 PNE 的 代价 为 有 -调和 级 


数 > 二 ， 此 数 介 于 Ink 和 Ink 十 1 之 间 ， 我 们 用 M 表示 。 





O ”此 论证 是 重复 剔除 严格 劣 策略 的 一 个 实例 。 当 此 过 程 剩 下 唯一 的 局 势 时 ， 它 就 是 此 博弈 的 唯一 的 
PNE. 
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X e 趋向 于 0 时 ， 退出 博弈 的 POA 接近 XH。 这 与 VHS WE Betamax 那个 例子 
不 同 ， 这 里 的 低 效 率 并 不 是 多 重 均衡 或 不 合理 均衡 所 导致 的 。 


15.2 稳定 的 代价 


前 一 节 的 两 个 例子 让 我 们 很 挫败 : 有 关 网 络 代价 分 摊 博 弈 中 最 差 情况 下 的 PNE， 
我 们 并 没有 得 到 任何 有 趣 的 结论 。 即 便 PNE 是 唯一 的 ， 其 代价 也 可 能 达到 最 优 局 势 
的 Hi 倍 。 本 节 将 证 明 ， 网 络 代价 分 摊 博 弈 的 最 优 (bestJPNE 有 如 下 保证 。 

定理 15. 1( 稳 定 的 代价 ) 在 任意 含有 上 个 智能 体 的 网 络 代 价 分 摊 博 弈 中 ， 总 存 
在 一 个 PNE， 其 代价 最 多 为 最 优 局 势 的 Hi 倍 。 

特别 地 ， 此 定理 断言 任意 网 络 代 价 分 挫 博 弈 中 都 存在 至 少 一 个 PNE。 由 退出 博 
弈 例子 可 知 ， 定 理 15. 1 中 的 因子 H 不 能 替换 为 更 小 的 数 。 

稳定 的 代价 (price of stability) 是 POA 的 一 个 “乐观 ”版 本 ， 其 定义 为 

最 优 均衡 的 代价 
最 优 局 势 的 代价 

因此 定理 15. 1 表明 在 任意 网 络 代价 分 摊 博 弈 里 ， 稳 定 的 代价 最 多 为 Hio 

定理 15. 1 的 证 明 : 网 络 代价 分 摊 博 弈 和 单元 自私 路 由 博弈 (12. 4 节 ) 具 有 相同 
的 形式 。 每 个 智能 体 i 在 网 络 中 选择 一 条 ord, 路 径 。 一 个 智能 体 的 代价 式 (15. 1) 
为 其 路 径 上 所 有 边 的 代价 之 和 ， 并且 每 条 边 的 代价 取决 于 使 用 此 边 的 智能 体 的 数 
目 。 一 条 边 e 的 “代价 函数 ”可 以 是 c,(f.) 二 7./f.， 其 中 /为 使 用 此 边 的 智能 体 的 
数目 。 

把 定理 13. 6 的 证 明 里 的 势 函 数 (13. 7) 应 用 到 网 络 代价 分 挫 博 穿 中 可 以 得 到 


oP) = >) me — vy 二 (15. 3) 
在 定理 13.6 证 明 中 ,能 将 函数 最 小 化 的 局 势 即 为 一 个 PNES。 例如 ,在 
VHS 还 是 Betamax 的 例子 中 ， 低 代价 的 PNE 可 以 将 式 子 (15. 3) 最 小 化 ， 而 高 代价 的 
PNE 则 不 能 。 但 是 ， 势 函数 的 最 小 化 算 子 不 一 定 是 最 优 PNE( 问 题 15. 1) ， 我 们 接 下 
来 证 明 其 代价 最 多 为 最 优 局 势 的 7 倍 。 
证 明 的 要 点 是 我 们 并 不 关心 势 函数 (15. 3) 本 身 的 具体 数值 ， 但 它 能 够 很 好 地 对 目 
RRRS. 2) 进 行 近似 。 更 精确 地 ， 由 于 对 于 任意 满足 Sl 的 边 e， 都 有 


f 

Sya 
AIRA 7 Ste + He 

i=1 


日 与 路 由 博弈 不 同 ， 网 络 代价 分 摊 博 弈 中 的 智能 体 的 代价 函数 是 随 着 智能 体 数 量 增 加 而 递减 的 ， 这 凸 
显 了 其 正 外 部 性 。 定理 13. 6 对 任意 的 边 代价 函数 都 成 立 ， 不 管 是 递减 的 还 是 其 他 的 。 
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因此 我 们 可 以 按照 所 有 这 样 的 边 对 上 式 累 加 ， 从 而 得 到 ， 对 于 任意 局 势 P， 

都 有 
cost(P) < BP) < H, + cost(P) (15. 4) 

不 等 式 (15. 4) 说 明 ，PNE 无 形 中 在 尝试 最 小 化 一 个 近似 正确 的 函数 B@， 因 此 ， 
一 个 PNE 能 近似 地 最 小 化 真正 的 目标 函数 ， 这 也 是 讲 得 通 的 。 

为 了 完成 证 明 ， 用 P 表示 能 够 将 势 函 数 (15. 3) 最 小 化 的 一 个 PNE， 用 P* 表示 最 
优 局 势 。 我 们 有 

cost(P) <= DP EVP" Y <= He oat(P" ) 

其 中 第 一 个 和 最 后 一 个 不 等 式 来 自 式 (15.4)， 中间 的 不 等 式 来 自 于 P 了 是 @ 的 最 小 化 
算 子 。 m 

应 当 如 何 理解 定理 15. 1? 相 比 于 POA 界 ， 稳 定 的 代价 的 界 只 能 保证 一 个 均衡 是 
近似 最 优 的 。 这 比 POA 的 界 所 提供 的 保障 弱 得 多 。 稳 定 的 代价 与 那些 具有 第 三 方 的 
博弈 有 关 ， 第 三 方 可 以 为 智能 体 建议 一 个 局 势 。 这 样 的 现实 场景 很 容易 找到 ， 在 这 类 
场景 中 ， 管 理 员 可 以 建议 一 个 高 效 的 均衡 。 例 如 政府 告诉 人 们 应 当 靠 路 的 哪 一 侧 行 
驶 。 另 外 一 个 计算 机 领域 的 例子 是 ， 为 软件 或 网 络 协议 中 的 用 户 自 定 义 参数 设 定数 值 
的 情境 。 一 个 合理 的 做 法 是 为 软件 或 协议 设置 一 个 默认 参数 值 ， 而 用 户 并 没有 动机 去 
更 改 这 些 默 认 值 。 在 此 基础 之 上 ， 再 对 软件 或 网 络 进行 性 能 优化 。 第 三 方 将 博弈 的 局 
势 限定 至 某 些 均衡 ， 这 样 的 限定 会 使 得 目标 函数 变 得 比 最 优 局 势 差 。 而 稳定 的 代价 就 
对 变 得 至 少 有 多 差 进 行 了 量化 。 

定理 15. 1 的 证 明 意味 着 任意 势 函 数 (15. 3) 的 最 小 化 算 子 所 造成 的 代价 最 多 为 最 
优 局 势 下 代价 的 Hi 倍 。 但 是 我 们 仍然 不 清楚 为 何 此 类 PNE 会 比 任意 其 他 PNE 更 重 
要 ， 详 见 说 明 。 这 给 了 我 们 关于 定理 15. 1 的 第 二 个 解释 ， 这 个 解释 无 须 涉 及 第 三 方 ， 
取而代之 的 是 ， 在 某 种 意义 上 ， 势 函数 的 最 小 化 算 子 是 最 重要 的 一 类 PNE, 


15.3 强 纳什 均衡 的 POA 


本 节 介 绍 另外 一 个 方法 ， 用 以 避 开 在 VHS 还 是 Betamax 例子 中 较 差 的 PNE， 并 
且 ， 针 对 网 络 代价 分 摊 博 弈 ， 还 为 均衡 的 低 效 率 找到 了 一 个 有 意义 的 界 。 我 们 再 一 次 
讨论 所 有 的 ( 即 最 差 情况 下 的 ) 均 衡 ， 但 是 首先 把 注意 力 放 在 一 类 合适 的 PNES 上 。 

一 般 来 说 ， 当 研究 一 类 博弈 里 均衡 的 低 效 性 时 ， 在 存在 有 意义 的 POA 界 的 前 提 
下 ， 我 们 应 当 尽 可 能 地 调查 更 大 的 均衡 概念 集 。 在 带 有 负 外 部 性 的 博弈 里 ， 例 如 路 由 
以 及 选 址 博弈 ， 我 们 将 调查 范围 放大 到 了 粗糙 相关 均衡 (第 14 章 )。 由 于 在 这 些 博弈 


日 ” 当 一 个 均衡 概念 比 另外 一 个 更 加 严格 时 ， 我们 称 前 者 是 后 者 的 一 个 均衡 精炼 (equilibrium refine- 


ment), 
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里 PNE 的 POA 都 接近 1， 这 个 值 合适 且 有 意义 ， 因 此 我 们 着 眼 于 将 最 差 情况 下 的 界 
扩展 到 一 个 更 大 的 均衡 概念 集 上 。 在 网 络 代 价 分 挫 博 弈 中 ， 最 差 情 况 的 PNE 可 以 是 
高 度 次 优 的 ， 所 以 我 们 需要 把 所 调查 的 均衡 概念 集 缩小 ， 直 到 有 意义 的 POA 界 能 被 
实现 。( 图 15. 3)。 


纯 策略 纳什 均衡 


强 纳什 均衡 





图 15.3 强 纳什 均衡 是 纯 策 略 纳什 均衡 的 一 个 特例 


回忆 一 下 VHS 还 是 Betamax 这 个 例子 (15. 1. 3 节 )。 由 于 智能 体 进行 单方 面 策略 
改变 会 支付 上 面 边 的 所 有 代价 1 十 e， 因 此 高 代价 的 局 势 是 一 个 PNE。 如 果 有 两 个 智 
能 体 联合 改变 到 上 面 的 边 上 会 如 何 ” 每 一 个 改变 的 智能 体 仅仅 支付 约 1/2。 因 此 这 对 
两 人 来 说 都 是 一 个 有 利 的 改变 。 我 们 可 以 得 出 结论 ， 当 允许 智能 体 组 成 联盟 来 偏离 均 
衡 时 ， 高 代价 的 PNE 并 不 能 维持 。 

定义 15. 2( 强 纳什 均衡 ) 用 s 表 示 代 价 最 小 化 博弈 里 的 一 个 局 势 。 

(a) 对 于 一 个 智能 体 子 集 A 来 说 ， 如 果 对 于 每 一 个 iE A， 都 有 Ci(sa4，s-4) 三 
C(s)， 那 么 就 称 策略 组 合 sh E I[s. 是 一 个 有 利 的 改变 (beneficial deviation), #7 


对 于 A 中 的 一 个 智能 体 ， 此 不 等 式 严 格 成 立 。 

(b) 如 果 不 存 在 任何 智能 体 联 盟 具 备 有 利 的 改变 ， 那 么 就 称 局 势 § 为 一 个 强 纳 什 
均衡 (strong Nash equilibrium ) 。 

每 一 个 强 纳什 均衡 都 是 一 个 纳什 均衡 ， 这 是 由 于 一 元 智能 体 联 盟 的 有 利 改变 就 
是 智能 体 单 方面 的 有 利 改 变 。 有 理由 相信 相 比 于 其 他 PNE， 强 纳什 均衡 更 有 可 能 
a 

为 了 更 好 地 理解 强 纳什 均衡 ， 我 们 回 到 之 前 的 两 个 例子 。 如 前 所 述 ， 在 VHS 还 
是 Betamax 例子 中 的 高 代价 PNE 不 是 一 个 强 纳什 均衡 。 而 低 代 价 PNE 是 一 个 强 纳 
什 均衡 。 更 一 般 的 ， 既 然 全 体 智 能 体 都 可 以 联合 ， 那 么 强 纳什 均衡 就 有 可 能 是 最 优 
的 。 当 所 有 智能 体 拥 有 共同 的 源 点 和 终点 时 就 是 这 样 ( 练 习 15. 3)， 但 一 般 来 说 它 并 
不 是 最 优 。 在 退出 博弈 里 (15. 4 节 )， 所 有 人 都 选择 退出 是 唯一 的 PNE， 此 PNE 也 是 
一 个 强 纳什 均衡 。 而 此 强 纳 什 均 衡 的 代价 可 以 任意 接近 最 优 局 势 的 KH 倍 。 接 下 来 的 
结果 将 说 明 ， 不 存在 比 这 更 差 的 情形 。 

定理 15. 3( 强 纳什 均衡 的 POA) 在 任意 包含 & 个 智能 体 的 网 络 代 价 分 摊 博 弈 中 ， 


x 








每 一 个 强 纳 什 均 衡 的 代价 最 多 为 最 优 局 势 的 Hy 倍 。 

定理 15. 3 中 的 保证 不 同 于 定理 15. 1。 从 正面 的 角 
度 看 ， 此 保证 对 任意 强 纳什 均衡 都 成 立 ， 而 定理 15. 1 
中 的 保证 只 对 一 个 PNE 有 效 。 如 果 在 任意 网 络 代 价 分 
摊 博 弈 里 ， 都 有 至 少 一 个 强 纳什 均衡 ， 那 么 定理 15. 3 
的 结论 将 严格 地 强 于 定理 15.1。 然 而 ， 强 纳什 均衡 在 
网 络 代价 分 摊 博 弈 里 有 可 能 存在 也 有 可 能 不 存在 ( 见 
图 15. 4 和 练习 15.4)， 因 此 定理 15.1 和 15. 3 一般 无 
法 进行 比较 。 





图 15.4 不 存在 强 纳什 均衡 的 
15.4 定理 15. 3 的 证 明 网 络 代价 分 挫 博 弈 


定理 15. 3 的 证 明和 之 前 对 POA 的 分 析 有 相似 之 处 , 但 是 它 的 证 明 还 包含 一 些 额 
外 的 技巧 。 其 中 一 个 特点 是 它 以 一 种 有 趣 的 方式 使 用 了 势 函数 (15. 3)。 注 意 到 我 们 对 
自私 路 由 和 选 址 博弈 里 的 POA 进行 分 析 时 并 没有 使 用 到 他 们 的 势 函 数 。 

固定 一 个 网 络 代价 分 摊 博 弈 以 及 一 个 强 纳什 均衡 P。 通 常 来 说 ， 分 析 POA 的 第 
一 步 是 对 每 个 智能 体 都 使 用 一 次 均衡 假设 ， 从 而 得 出 智能 体 的 均衡 代价 的 上 界 。 为 了 
以 最 强 的 方式 使 用 强 纳什 均衡 假设 ， 我 们 先 从 全 体 智 能 体 A, 二 {1，2，…, 上 } 这 个 最 
大 的 联盟 开始 。 那 么 为 何 这 个 团体 不 会 改变 到 最 优 局 势 P 呢 ? 原因 是 对 于 某 个 智能 
体 i, — EA C;CP)<C,(P*)° 。 对 所 有 智能 体重 新 编号 使 得 此 智能 体 为 &。 

我 们 需要 的 不 仅仅 是 智能 体 & 的 均衡 代价 的 上 界 ， 而 是 需要 每 个 智能 体 代 价 的 上 
界 。 为 了 保证 能 够 得 到 一 个 新 的 智能 体 的 上 界 ， 我 们 需要 对 排除 了 智能 体 & 的 联盟 
Ai 一 (1，2，…，A 一 1} 使 用 强 纳什 均衡 假设 。 为 何 这 些 智 能 体 不 会 改变 到 Pi E? 
肯定 是 对 于 某 个 智能 体 jiE (1, 2, =, k—1}, AC CP)<C,(Pi_.. Pi). MAH E 
的 智能 体重 命名 ， 使 得 此 不 等 式 对 智能 体 — 1 成 立 。 

重复 地 使 用 上 述 过 程 ， 我 们 可 得 到 所 有 智能 体 的 一 个 重 命名 排列 {1，2，… ,上 }， 
且 对 于 任意 i 和 A; 二 {1， 2; s ths PRA 

CAP) CPR Paa) (15.5) 

既然 现在 有 了 每 个 智能 体 均 衡 代 价 的 上 界 ， 我 们 可 以 针对 所 有 智能 体 把 式 (15. 5) 

加 起 来 ， 从 而 得 到 


tel 


k 
cost(P)= JCP) 
i=] 





O ”如果 至 少 有 一 个 其 他 的 智能 体 的 情况 变 得 更 好 ， 那 么 此 不 等 式 严格 成 立 ， 不 过 我 们 用 不 到 这 么 强 的 
结论 。 
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k 
= SOLES Pa) (15. 6) 
i=1 


k 
= > OAPs (15. 7) 
i=l 


不 等 式 (15.6) 可 从 式 (15. 5) 直 接 得 到 。 不 等 式 (15.7) 是 由 于 网 络 代价 分 挫 博 弈 的 正 外 
部 性 特性 ( 移 除 智 能 体 仅 能 减少 使 用 此 边 的 智能 体 的 数目 ， 因 而 只 会 提高 剩余 智能 体 
对 此 边 的 代价 的 分 扒 )。 不 等 式 (15.7) 的 目的 是 简化 均衡 代价 的 上 界 ， 使 其 可 变 为 一 
个 可 缩放 的 和 。 

接 下 来 我 们 使 用 式 (15. 3) 中 的 势 函数 @。 用 Sf, 表示 在 局 势 P" 下 ,A, 中 其 路 径 
包含 边 e 的 智能 体 的 数目 ， 由 此 我 们 有 


CPi.) = D) = PPA) — BCPA, ,) (15. 8) 
ee pr + © 


第 二 个 等 号 由 @ 的 定义 可 得 。 
结合 式 (15.7) 和 式 (15. 8)， 可 得 到 


cost(P)< >) [@(Pi, ) 一 更 (Pi 7 
i=l 


=(P") 

< He: + cost(P* ) (15. 9) 
其 中 不 等 式 (15. DKA FHS. 4), MARK @ 仅 能 以 最 大 Xi 倍 的 误差 过 高 估计 一 
个 局 势 的 代价 。 至 此 完成 了 定理 15. 3 的 证 明 。 


总 结 


© 在 网 络 代价 分 摊 博 弈 里 ， 每 个 智能 体 需 要 选择 一 条 从 源 点 到 终点 的 路 径 ， 并 
且 每 条 边 上 的 固定 代价 由 所 有 使 用 此 边 的 智能 体 平 摊 。 

© 在 一 个 网 络 代价 分 捧 博 弈 里 ， 不 同 的 PNE 所 产生 的 代价 差异 很 大 ， 并且 POA 
可 以 高 达 智 能 体 的 数目 &。 这 些 事实 激励 我 们 关注 近似 界 ， 这 些 近似 界 仅 适 用 
T PNE 的 = 一 个 了 于 第 。 

e 博弈 的 稳定 的 代价 定义 为 均衡 的 最 低 代价 与 最 优 局 势 的 代价 的 比值 。 


。 网 络 代价 分 挫 博 弈 里 最 差 情况 下 的 稳定 的 代价 为 M 一 D) 二 = Ink, 


o 一 个 强 纳什 均衡 是 指 一 个 这 样 的 局 势 ， 在 该 局 势 下 ， 不 存在 任何 这 样 的 智能 
体 的 联盟 : 当 这 个 联盟 进行 集体 策略 改变 时 ， 至 少 有 一 个 智能 体 变 得 更 好 并 
且 联 盟 里 的 其 他 智能 体 都 没有 损失 。 
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o 网 络 代价 分 捧 博 弈 里 的 任意 强 纳什 均衡 的 代价 最 多 为 最 优 局 势 的 XK 倍 。 
o 强 纳什 均衡 在 网 络 代价 分 摊 博 弈 里 不 一 定 存 在 。 


说 明 


网 络 代 价 分 挫 博 弈 以 及 定理 15. 1 出 自 Anshelevich 等 (2008a)。VHS 还 是 Be- 
tamax 示例 出 自 Anshelevich 等 (2008b) 。 还 有 一 些 其 他 类 型 的 网 络 构建 模型 被 提出 和 
研究 ， 详 见 Jackson(2008) 。 分 析 无 向 网 络 代 价 分 摊 博 弈 里 的 最 差 情 况 下 的 稳定 的 代 
价 是 一 个 开放 性 问题 ， 了 解 最 新 进展 详 见 Bilo 等 (2016) Chen 和 Chen(2011) 给 出 了 
一 些 实验 性 的 证 据 ， 说 明了 相 比 于 其 他 PNE， 参 与 者 更 常 使 用 势 函 数 的 最 小 化 算 子 。 
相关 的 理论 性 结果 出 现在 Blume(1993)，Asadpour 和 Saberi(2009)。 强 纳什 均衡 概 
念 出 自 Aumann(1959), Andelman 等 (2009) 正 式 提出 研究 强 纳什 均衡 的 POA。 定 理 
15. 3( 也 即 图 15. 4 中 的 例子 ) 以 及 问题 15.2 KA Epstein 等 (2009) 。 


练习 


练习 15. 1 证 明 在 任意 网 络 代价 分 挫 博 弈 里 ，PNE 的 POA 最 多 为 &， 即 智能 体 的 个 数 。 

练习 15. 2” 如果 我 们 修改 退出 博弈 (15. 1. 4 节 )， 使 得 所 有 的 边 变 为 无 向 的 并 且 每 个 
智能 体 守 可 以 选择 一 条 沿 任意 方向 进出 边 的 ord: 路 径 ， 那 么 此 场景 下 ， 
网 络 代价 分 摊 博 弈 的 稳定 的 代价 是 多 少 ? 

练习 15. 3 证 明 在 智能 体 有 相同 的 源 点 和 终点 的 网 络 代 价 分 摊 博 弈 里 ， 强 纳什 均衡 
和 最 小 代价 局 势 存在 一 一 对 应 的 关系 。( 因 此 在 此 类 博弈 里 ， 强 纳什 均衡 
总 是 存在 并 且 POA 为 1。) 

练习 15. 4 证 明 如 图 15.4 里 的 网 络 代 价 分 摊 博 弈 不 存在 强 纳什 均衡 。 

练习 15.5 扩展 网 络 代价 分 挫 博 弈 模型 ， 使 得 每 条 边 。 的 代价 y.(x) 可 以 依赖 于 使 用 此 
边 的 智能 体 的 数目 xz。 联合 代价 7, (xz) 仍然 由 zz 个 智能 体 平 挫 。 假设 x, EM 
的 ， 也 即 对 每 个 i=1，2，…，k 一 1 Er GHD yY yli). 
扩展 定理 15.1 和 15.3 到 这 个 更 一 般 化 的 模型 。 

练习 15. 6 (HH) 接 着 上 一 个 练习 ， RRMERWe, Ay (a)=a2’, HH a >0 是 一 
个 正常 数 并 且 指 数 p 属于 (0，1]。 对 于 此 特例 ， 提 升 定理 15.1 和 15. 3 
里 的 上 界 A, 至 1/p( 与 智能 体 数目 无 关 )。 


问题 


问题 15. 1 (a) 给 出 一 个 网 络 代价 分 摊 博 弈 ， 使 得 势 函数 (15. 3) 的 最 小 化 算 子 并 不 是 
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最 低 代价 的 PNE, 
(b) 给 出 一 个 存在 至 少 一 个 强 纳什 均衡 的 网 络 代价 分 挫 博 弈 ， 使 得 势 函 
数 的 最 小 化 算 子 并 不 是 一 个 强 纳什 均衡 。 
问题 15. 2 ”假设 我 们 弱化 强 纳什 均衡 的 定义 (定义 15.2)， 仅 要 求 不 存在 至 多 /个 智 
能 体 组 成 的 联盟 具备 有 利 策略 改变 (LE {1，2，…, 上 &) 为 一 个 参数 )。 纯 
策略 纳什 均衡 和 强 纳什 均衡 分 别 对 应 于 /二 1 Ak 的 场景 。 那 么 网 络 代 
价 分 摊 博 弈 里 的 一 个 /- 强 纳什 均衡 的 最 差 情 况 下 的 POA( 写 为 1 和 的 函 
数 ) 是 多 少 ? 证 明 你 能 给 出 的 最 好 的 上 界 和 下 界 。 
问题 15.3 〈H) 给 定 任 意 单元 自私 路 由 网 络 (12.4 节 )， 其 中 每 条 边 的 代价 函数 为 非 
负 系 数 的 多 项 式 ， 并 且 边 的 度数 最 多 为 p»， 证 明 此 场景 下 的 稳定 的 代价 最 
多 为 p 十 1。 
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本 章 进 入 本 书 的 第 三 部 分 ， 我 们 首先 问 这 么 一 个 问题 : 能 否 期 望 这 些 策略 性 的 智 
能 体会 自动 达到 均衡 状态 ?如 果 可 以 的 话 ， 那 么 哪 一 种 学 习 算 法 能 够 快速 收敛 到 一 个 
均衡 ? 给 出 这 些 问 题 的 管 案 需 要 给 定 特 定 的 动力 学 系统 。 此 动力 学 系统 描述 了 当 智能 
体 不 在 均衡 状态 时 的 行为 模式 。 考 虑 如 下 动力 学 系统 : 系统 中 智能 体 的 行为 由 某 一 算 
法 所 确定 ， 这 个 算法 尝试 学 习 针 对 其 他 智能 体 行为 的 最 优 反应 。 理 想 而 言 ， 我 们 想 要 
找到 一 些 适 用 于 简单 自然 的 学 习 算 法 下 的 结果 。 这 样 的 话 ， 即 便 智能 体 可 能 不 会 完全 
遵循 给 定 的 算法 ， 我 们 仍然 可 以 对 如 下 判 句 抱 有 信念 : 得 到 的 结论 是 鲁 棒 的 ， 它 不 是 
特定 选择 的 动力 学 系统 中 的 人 工 产物 。 本 章 关注 几 个 “最 优 反应 动力 学 ”的 变种 ， 并 
且 在 接 下 来 的 两 草 中 研究 基于 遗憾 最 小 化 的 动力 学 系统 。 

16. 1 节 给 出 最 优 反应 动力 学 的 定义 并 证 明 其 在 势 博弈 中 的 收敛 性 ; 16.2 和 16. 3 
节 引 入 s- 最 优 反应 动力 学 并 证 明 此 动力 学 的 某 些 变种 能 够 在 单元 自私 路 由 博弈 中 ( 假 
设 所 有 智能 体 具有 相同 的 起 点 和 终点 ) 快 速 收敛 ; 16.4 节 证 明 ， 针 对 第 14 章 定义 的 
人，/) -平滑 博弈 ， 最 优 反应 动力 学 的 几 个 变种 能 够 使 得 目标 函数 值 快 速达 到 与 均衡 
状态 相 媲美 的 状态 。 


16.1 势 博弈 中 的 最 优 反应 动力 学 


最 优 反 应 动力 学 是 很 直接 的 过 程 ， 在 此 过 程 里 每 个 智能 体 可 以 通过 连续 性 的 单方 
面 的 策略 改变 来 搜寻 博弈 中 (定义 13.2) 的 一 个 纯 策略 纳什 均衡 (PNE)， 








最 优 反应 动力 学 
只 要 目前 的 局 势 s 不 是 一 个 PNE: 
任意 选择 一 个 智能 体 i 以 及 一 个 对 i 有利 的 策略 改变 s;， 然 后 更 新 局 势 为 


Cs! , SaNa 








针对 智能 体 i 和 有 利 的 策略 改变 s+ ， 可 能 存在 多 个 可 供 选 择 的 方案 。 现 在 我 们 对 
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这 两 者 不 做 特定 的 解释 ， 等 到 后 面 有 需要 的 时 候 再 明确 说 明 S 。 我 们 允许 任意 的 初始 
局 势 。 

最 优 反 应 动力 学 可 以 抽象 成 在 一 张 图 上 行走 。 其 中 图 中 每 个 顶点 为 一 组 策略 组 
合 ， 每 条 出 边 代表 一 个 有 利 的 策略 改变 (图 16. 1)。PNE 可 以 用 图 中 那些 没有 出 边 的 
顶点 来 精确 刻画 。 由 于 最 优 反 应 动力 学 只 会 在 达到 一 个 PNE 后 才能 停止 ， 那么 如 果 
一 个 博弈 中 不 存在 PNE， 则 对 应 的 动力 学 会 一 直 循 环 下 去 。 另 外 ， 在 一 些 存在 PNE 
的 博弈 中 ， 最 优 反应 动力 学 也 有 可 能 一 直 循 环 (练习 16.1). 

最 优 反应 动力 学 是 势 博弈 ( 见 13. 3 节 ) 的 一 个 完美 拟 合 。 在 势 博弈 中 ， 我 们 定义 
了 一 个 实 值 函数 @ 使 得 对 某 智能 体 的 任 一 单 边 策 略 改变 ， 势 函数 的 改变 值 等 于 偏离 
者 在 代价 上 的 改变 (13. 9) 。 路 由 博弈 (12. 4 节 )、 选 址 博弈 (14. 2 节 ) 和 网 络 代 价 分 挫 
博弈 (15. 2 节 ) 都 属于 势 博弈 。 

定理 13.7 表明 ， 任 一 势 函数 都 有 一 个 最 小 值 算 子 ， 因 此 势 博弈 至 少 有 一 个 PNE( 即 此 
最 小 化 算 子 ) 。 对 于 该 结论 ， 最 优 反应 动力 学 提供 了 一 个 更 具 启发 性 的 证 明 。 

命题 16. 1( 最 优 反 应 动力 学 的 收敛 性 ) 在 势 博弈 中 ， 从 任意 一 个 初始 局 势 开始 ， 
最 优 反应 动力 学 都 会 收 你 到 一 个 PNE。 

证 明 : 在 最 优 反应 动力 学 里 的 每 一 轮 里 ， 策 略 改变 者 的 代价 严格 减少 。 由 (13. 9) 
可 知 ， 势 函数 也 是 严格 下 降 的 。 因 此 ， 不 存在 无 穷 循环 。 由 于 我 们 假设 博弈 是 有 限 
的 ， 因 此 最 优 反应 动力 学 最 终 会 停止 ， 即 必然 在 达到 一 个 PNE 后 停止 。 m 

对 应 到 图 16.1 上 ， 命 题 6. 1 断言 一 个 有 向 无 环 图 中 的 行走 将 最 终 停留 在 没有 出 
边 的 顶点 上 。 





图 16.1 最 优 反应 动力 学 可 以 看 作 是 在 一 张 图 上 的 行走 。 每 一 个 策略 组 合 对 应 于 一 个 顶点 。 每 一 
个 有 利 的 策略 改变 可 由 图 上 的 一 条 边 来 指定 ， 边 上 的 标记 为 进行 策略 改变 的 智能 体 。 
PNE 对 应 于 那些 没有 出 边 的 顶点 集 ， 比 如 5 





O ”这 个 过 程 有 时 被 称 为 “ 较 佳 反应 动力 学 "， 而 “最 优 反应 动力 学 ”这 个 术语 通常 用 于 表示 “选择 一 个 
能 够 最 小 化 i 的 代价 ”的 策略 si (给 定 其 他 智能 体 的 策略 组 合 5-,)。 
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命题 16. 1 表明 在 势 博 弈 中 ， 有 一 个 很 自然 的 过 程 能 够 使 得 所 有 智能 体 达 到 
PNE。 那 么 这 个 过 程 有 多 快 呢 ? 一 个 “快速 收敛 ”的 强 概 念 是 指 此 过 程 能 在 合理 
的 少量 轮 次 后 收敛 到 一 个 PNE。 比 如 当 势 函数 下 定义 在 少量 的 不 同 的 值 上 时 ( 练 
习 16.2)， 这 种 情况 就 会 发 生 。 一 般 情况 下 ， 势 函数 在 最 优 反应 动力 学 中 下 降 得 
非常 慢 并 且 需 要 指数 (智能 体 的 数目 为 指数 ) 轮 次 后 才 会 收敛 ( 见 第 19 章 )。 这 
个 事实 促使 我 们 使 用 弱化 的 收敛 性 的 定义 ， 在 接 下 来 的 内 容 里 我 们 会 对 其 进行 具 
ADT FE 


16.2 自私 路 由 博弈 中 的 近似 PNE 


我 们 第 二 个 “快速 收 僵 ”的 概念 适用 于 近似 PNE 中 。 

定义 16. 2(s- 纯 策略 纳什 均衡 ) 对 eE[0，1]， 给 定 代价 最 小 化 博弈 的 局 势 s P, 
如 果 对 每 一 个 智能 体 i 和 策略 s';ES;， 有 

Cilsi ,si;) (1—e).» C(s) (16. 1) 

那么 称 局 势 s 为 一 个 e- 纯 策略 纳什 均衡 (e-PNE)，。 

定义 16.2 和 定义 14. 5 是 一 样 的 ， 只 是 为 了 方便 分 析 ， 重 新 进行 了 参数 化 。 定 义 
16. 2 的 一 个 e-PNE 对 应 于 定义 14, 5 中 的 一 个 e/(1 一 e)-PNE。 

接 下 来 我 们 研究 e- 最 优 反 应 动力 学 ， 此 动力 学 只 允许 那些 能 够 产生 重要 性 能 提升 
的 智能 体 进行 策略 改变 。 





e- 最 优 反 应 动力 学 
只 要 当前 输出 s 不 是 一 个 e-PNE;: 
任意 选取 一 个 有 e- 行 动 的 智能 体 谍 一 个 e- 行 动 即 为 使 得 Ci(si，s-i) 过 (1 一 e)， 
Cils) 的 一 个 策略 si ) 并 任意 选取 i 的 一 个 e- 行 动 。 更 新 局 势 为 (s;，s_;)。 





e- 最 优 反 应 动力 学 只 能 在 达到 一 个 PNE 后 才 停 止 ， 并 且 它 在 任意 势 博弈 中 都 会 
收敛。 

接 下 来 的 结果 识别 出 了 单元 自私 路 由 博弈 的 一 个 子 类 。 在 这 类 博弈 中 ， 一 个 特定 
的 e- 最 优 反 应 动力 学 能 够 快速 收敛 ， 即 此 过 程 能 在 若干 轮 中 收 僵 。 收 敛 轮 数 的 上 界 是 
所 有 相关 参数 的 一 个 多 项 式 函 数 。° 





O 在 含有 个 智能 体 的 博弈 中 ， 所 有 可 能 局 势 的 数量 是 关于 的 指数 函数 ， 因 此 任意 一 个 收敛 所 需 轮 数 
的 多 项 式 界 都 是 非常 有 意义 的 。 
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e- 最 优 反应 动力 学 (最 大 回报 ) 
只 要 当前 局 势 s 不 是 一 个 e-PNE: 
在 所 有 拥有 e- 行 动 的 智能 体 中 ， 用 i 表示 能 获得 最 大 代价 下 降 


Ci(s) — minC;(5;.s_;) 
2,€S, 
的 智能 体 。 
并 用 表示 i 针对 s_; 的 一 个 最 优 反 应 。 
更 新 局 势 为 (s;，s_,)。 








定理 16. 3(s-PNE 的 收敛 性 ) 考虑 单元 自私 路 由 博弈 ,假设 : 

1. 所 有 智能 体 都 有 相同 的 源 点 和 终点 。 

2. 对 a 宇 1]， 每 条 边 。 的 代价 函数 cv 满足 a- 限 界 跳 跃 条 件 ， 即 对 每 一 条 边 e 和 正 
Agr Ac (atlele (x), a. clr] 


Cs’) 


p 轮 后 收敛 到 一 个 E- 


那么 ，e- 最 优 反应 动力 学 的 最 大 回报 变种 最 多 在 <n 
PNE， 其 中 5 是 初始 局 势 ，,i = ming Cs), 

在 很 多 e- 最 优 反 应 动力 学 的 变种 中 ， 与 定理 16.3 类 似 的 结论 也 是 成 立 的 ( 问 
题 16.2); 对 于 这 些 变 种 的 核心 要 求 是 要 给 每 个 智能 体 充分 多 的 机 会 进行 行动 。 尽 管 我 
们 不 能 强求 智能 体 都 按照 e- 最 优 反应 动力 学 的 某 个 变种 行动 ， 但 是 在 这 些 博弈 中 “简单 
自然 的 学 习 过 程 能 快速 收敛 到 一 个 近似 PNE” 的 事实 为 研究 智能 体 的 行为 提供 了 强 有 
力 的 证 据 。 遗 憾 的 是 ， 如 果 定理 16. 3 中 的 任何 一 个 假设 不 成 立 ， 那么 所 有 e- 最 优 反 应 
动力 学 的 变种 都 有 可 能 花费 指数 (以 为 指数 ) 轮 数 收敛 ( 见 说 明 )。 


16.3 定理 16. 3 的 证 明 


定理 16. 3 的 证 明 思 路 是 首先 从 下 降 量 上 强化 命题 16.1， 然 后 说 明 最 大 回报 e- 最 
优 反 应 动力 学 在 每 一 轮 中 都 大 幅 减 少 了 势 函数 。 为 此 需要 两 个 引 理 。 第 一 个 引 理 确保 
了 高 代价 智能 体 的 存在 性 ; 如 果 这 个 智能 体 在 一 轮 中 被 选 定 进行 行动 ， 那 么 势 函数 会 
大 幅 下 降 。 问 题 在 于 在 一 轮 中 有 可 能 是 其 他 某 个 智能 体 行动 。 第 二 个 引 理 需 要 用 到 定 
H 16. 3 的 两 个 假设 ， 此 引 理 证 明了 被 选中 行动 的 智能 体 的 代价 是 其 他 任何 智能 体 的 
a 信 。 这 点 就 足以 证 明 最 大 回报 e- 最 优 反应 动力 学 能 够 快速 收敛 。 

引 理 16. 4 在 任意 一 个 局 势 s 中 ， 都 存在 一 个 智能 体 i， 有 Ci(s) 宇 B(s)/k。 

证 明 : 在 拥有 非 递减 代价 函数 的 单元 自私 路 由 博弈 中 ， 势 函数 只 会 低估 一 个 局 势 
的 代价 。 原 因 是 ， 由 势 函 数 的 定义 (13.7) 以 及 单元 自私 路 由 博弈 的 目标 函数 (11. 3) 一 
(11.4) 可 知 ， 对 于 任意 一 个 局 势 s 可 得 
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fe k 
ts) = Sat = Vf ck f= Ew (16. 2) 
EE i=1 


EE i=l 


其 中 f. 表示 策略 组 合 s 中 所 有 路 由 策略 中 包含 边 e 的 智能 体 数 。 中 间 的 不 等 式 来 自 
代价 函数 非 递减 的 特性 。 

由 于 存在 某 个 智能 体 ， 其 代价 至 少 为 所 有 代价 的 平均 值 ， 因 此 对 于 任意 局 势 s， 我 们 有 
yc) 


maxC,(s) > = z > Pts) 
i=l 


k 
下 一 个 引 理 把 最 大 回报 e- 最 优 反应 动力 学 中 进行 策略 改变 的 智能 体 的 代价 与 其 他 
智能 体 的 代价 联系 起 来 。 
引 理 16.5 假设 在 局 势 s 中 ， 最 大 回报 e- 最 优 反 应 动力 学 选择 智能 体 i 进行 行 
动 ， 并 且 此 智能 体 采 取 了 一 个 6- 行动 ss 。 那 么 对 于 任何 其 他 智能 体 ij， 都 有 


， 得 证 5 





C:s) — Ci(s',s;) > £C;(s) (16. 3) 
a 


证 明 : 固定 智能 体 7。 如 果 在 s 中 ) 有 一 个 e- 行 动 s;， 由 定义 可 知 j7 采 取 这 个 行 
动 将 会 使 自身 代价 减少 至 少 e。C;(s)， 所 以 有 
C;(s) = C, Cs, 3s) S C,(s) —C, Cs; »s_,) S eC; (8) 
第 一 个 不 等 式 成 立 是 因为 ， 在 最 大 回报 e- 最 优 反 应 动力 学 里 是 i 而 不 是 j 被 选中 行动 。 
一 个 琅 手 的 情况 出 现在 智能 体 j 没有 -行动 的 时 候 。 在 这 里 我 们 假设 所 有 智能 体 
都 有 相同 的 可 行 策略 集 。 如 果 s; 对 智能 体 i 来 说 是 一 个 非常 不 错 的 偏 移 的 话 ， 那 么 这 
个 策略 有 可 能 对 7 也 是 如 此 。 也 就 是 说 ， 如 果 
C; (si ss) < O —e)C; (s) (16. 4) 
那么 怎么 会 有 
C418) > a—)C@) (16. 5) 
一 个 关键 点 是 ， 在 局 势 (s; ，s_;) 和 (s; ，s-;) 中 至 少 有 上 一 1 个 共同 的 策略 。 这 些 
策略 包含 了 前 面 局 势 里 i 和 后 面 局 势 里 j 使 用 的 策略 s; 以 及 除了 i 和 j 之 外 的 剩余 智 
能 体 在 两 个 局 势 中 使 用 的 & 一 2 个 相同 的 策略 。 由 于 在 两 个 局 势 里 只 有 一 个 不 同 的 策 
略 ， 那 么 对 于 网 络 中 的 任意 一 条 边 e 来 说 ， 使 用 边 e 的 智能 体 的 数量 在 两 个 局 势 里 最 
多 相差 1。 由 定理 16. 3 的 a- 限界 跳跃 假设 可 知 ， 在 两 个 局 势 里 的 每 条 边 的 代价 最 多 
相差 a 倍 。 特 别 地 ， 使 用 策略 s 的 智能 体 j 的 代价 最 多 是 使 用 相同 策略 的 智能 体 i 的 
代价 的 a 倍 : 
Ca 185) S CG; 18 (16. 6) 
不 等 式 (16. 4) ~ (16. 6) 表 明 C (s)<a* C(s). BRU. 4) 有 


GOCCs sD Be + CNS + Ci(s) 


得 证 。 m 


* 


RUER BAA F 159 








引 理 16. 4 保证 了 总 是 存在 一 个 智能 体 ， 此 智能 体 的 e- 行 动 会 大 幅度 地 降低 势 函 
数 。 引 理 16. 5 使 得 这 个 结论 扩展 到 最 大 回报 s- 最 优 反应 动力 学 中 被 选 定 行动 的 智能 
体 上 。 由 此 现在 可 以 直接 求 得 收 义 所 需 轮 数 的 上 界 。 

定理 16. 3 的 证 明 : 在 最 大 回报 e- 最 优 反 应 动力 学 中 任 一 轮 里 ， 假 设 智 能 体 i 按 
照 策 略 s; 进行 了 一 次 -行动 ， 那么 


Bs) — Bs! 5s) = Ci(s) — Cils! ss) (16. 7) 
> £ . max C,(s) (16. 8) 

a jet 
> = . Hs) (16. 9) 


ak 

其 中 等 式 (16.7) 来 自 势 函数 的 定义 (13.9)， 不 等 式 (16.8) 和 (16. 9) 分 别 来 自 
引 理 16.5 和 16. 4。 

式 (16.7) 一 (16.9) 表 明 最 大 回报 s- 最 优 反应 动力 学 中 的 每 一 轮 都 把 势 函 数 的 值 减 
少 了 至 少 1 一 e/ak fi. FARE ka/e 轮 将 会 把 势 函 数 减少 至 少 e 王 2.718… 倍 8 。 由 于 势 
函数 的 初始 值 为 B(s" ) 并 且 不 可 能 低 于 Bi,， 因 此 最 大 回报 e- 最 优 反 应 动力 学 最 多 在 


各 ln PS ae py a = 


16.4 平滑 势 博弈 中 的 低 代 价 结果 


ee eat 在 此 局 势 下 目标 函 
数 的 值 几乎 与 智能 体 达 到 近似 PNE 时 一 样 。 这 一 局 势 虽然 不 一 定 收敛 到 一 个 近似 
PNE， 但 仍 具 有 吸引 力 。 So em RT POA 界 时 ， 这 个 稍微 弱 一 点 
的 概念 可 以 作为 收敛 到 一 个 近似 均衡 状态 的 无 损 蔡 代 品 。 

弱化 快速 收敛 的 概念 能 够 得 到 许多 泛 化 的 结果 。 下 一 个 结果 适用 于 所 有 满足 (4， 
OP TATE Ce XC 14.2) 的 势 函 数 ， 包 含 所 有 单元 自私 路 由 博弈 (12. 4 节 ) 和 选 址 博弈 
(14. 2 节 )。 这 个 结果 使 用 如 下 最 优 反应 动力 学 的 变种 ， 此 变种 和 定理 16. 3 中 使 用 的 
e- 最 优 反应 动力 学 的 变种 类 似 。 





最 优 反应 动力 学 (最 大 回报 ) 
只 要 当前 输出 不 是 一 个 PNE: 
在 所 有 存在 有 利 策略 改变 的 智能 体 中 ， 用 i 表示 能 够 获得 最 大 代价 下 降 








© HEE #0., (1-2) <(e°-*)'/*=1/e, 
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Ci(s) 一 minC, ($; +s.) 
的 智能 体 。 
用 s; 表示 智能 体 对 s_; 的 一 个 最 优 反 应 。 
更 新 局 势 为 (s; ，s_,;)。 








我 们 在 代价 最 小 化 博弈 中 陈述 过 这 个 定理 ， 类 似 的 结论 同样 适用 于 (X44)- 平 滑 
收益 最 大 化 博弈 (备注 13. 1) 。 

定理 16.6( 低 代价 局 势 的 收敛 性 ) ”考虑 一 个 (4，j)- 平 滑 代 价 最 小 化 博弈 (j 过 
1)， 此 博弈 有 一 个 正 的 势 函数 D; 对 于 任意 局 势 s， 有 BC(s) 二 cost(s)。 用 s,s 
表示 在 最 大 回报 最 佳 动力 学 里 生成 的 一 系列 的 局 势 ， 用 8 表示 最 小 代价 局 势 ， 给 定 


参数 JE (0，1) 。 n ZD 





aa 个 局 势 外 ， 剩余 局 势 s, 都 满足 


cost(s') cost(s* ) (16. 10) 


< Sir 
其 中 Onn = min Dls), k 是 智能 体 的 数目 。 

我 们 知道 在 (4，y)- 平 滑 代 价 最 小 化 博弈 中 ,任意 PNE 里 的 代价 最 多 是 最 小 代价 
AY A/1—p) fF 14. 4 节 )。 因 此 定理 16. 6 是 说 序列 里 绝 大 部 分 局 势 中 的 代价 几乎 和 最 
优 反应 动力 学 收敛 到 PNE 中 的 代价 一 样 低 。 

定理 16.6 的 证 明 : 固定 wE (0，1)。 我 们 的 计划 是 ， 首 先 说 明 如 果 8 是 一 个 不 满 
足 式 (16. 10) 的 坏 状 态 ， 那么 在 下 一 轮 里 最 大 回报 最 佳 动力 学 将 会 大 幅度 降低 势 函 数 
的 值 。 这 点 就 能 直接 导出 所 有 坏 状 态 数 目的 上 界 。 

对 局 势 ss ， 定 义 6,(s') 二 Ci(s') 一 Ci(s;，s',) 为 智能 体 i 转换 策略 为 s;” 时 的 代价 


差 ， 并 令 Als) = 2 6;(s') 。 当 8% 是 一 个 PNE ft, & (Cs ) 的 值 是 非 负 的 ， 但 是 在 一 


般 情况 下 此 值 可 正 可 负 。 利用 此 定义 以 及 (A4，)- 平 滑 代价 最 小 化 博弈 的 典型 性 质 
( 式 (14.9))， 我 们 可 以 得 出 


k 
cost(S )< Saw) 
i=1 
k 
= SOLCiGs? st.) +8;6s)] 
i=] 


k 
<A cost(s* ) + p * cost(s') + 5a) 
i=l 


所 以 有 
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costs’) < saardi ac) (16. 11) 
=y -= 


此 不 等 式 意味 着 只 有 当 A(s') (智能 体 单方 面 改变 策略 到 s” 所 形成 的 代价 差 的 
和 ) 比 较 大 的 时 候 ， 状 态 s' 才 可 能 是 一 个 坏 状 态 。 
在 一 个 坏 状 态 s 下 ， 使 用 不 等 式 (16. 11) 以 及 假设 B(s)<cost(s), A 
ACs) > qO — p)cost(s') > 7 — p)@(s') (16. 12) 
如 果 某 智能 体 i 在 局 势 s 中 切换 策略 为 最 优 反 应 ， 那 么 他 的 代价 至 少 降低 6.Cs)。( 当 
他 的 最 优 反应 s; 比 s; 要 好 的 时 候 ， 其 代价 能 够 下 降 得 更 多 .) 不 等 式 (16. 12) 表 明 在 一 个 坏 


(1—) 
状态 s' 中 ， 最 大 回报 最 优 反应 动力 学 中 被 选 定 行动 的 智能 体 的 代价 至 少 会 下 降 一 全 
O(s'), HF 6 是 一 个 势 函 数 并 且 满 足 式 (13. 9) ， 因 此 只 要 s 是 一 个 坏 状 态 ， 我 们 有 


nl — p) 
k 


DC) < @(s') — max & Cst) < (1— J Bs!) 


EE 动力 学 中 的 每 一 轮 中 都 是 下 降 的 ， 因 此 上 述 不 等 式 意 





味 着 对 于 任意 -0 和 个 坏 状态 的 局 势 序列 ， 势 两 数 至 少 下 降 。 一 2.718.… 傍 。 由 此 得 

出 所 有 坏 状态 数目 的 上 界 为 -cj 和 ln SS. ° 
7 vain 

BS 


© 在 最 优 反应 动力 学 的 每 一 轮 中 ， 某 智能 体 可 以 改变 到 一 个 更 好 的 策略 。 

© 在 任意 势 博弈 里 ， 最 优 反应 动力 学 都 必然 收敛 到 一 个 PNE。 

o 在 同 源 同 终点 的 单元 自私 路 由 博弈 中 ， 几 个 e- 最 优 反 应 动力 学 的 变种 (只 允许 
产生 重要 性 能 提升 的 智能 体 进行 行动 ) 都 能 快速 收敛 到 一 个 近似 的 PNE。 

在 (M，j0)- 平 滑 博 弈 中 ， 几 个 最 优 反应 动力 学 的 变种 能 够 快速 达到 一 个 局 势 ， 
此 局 势 下 的 目标 函数 的 值 和 达到 PNE 时 的 值 几乎 一 样 好 。 


说 明 


命题 16.1 和 练习 16.3~16.4 出 自 Monderer 和 Shapley(1996)。 定 理 16.3 All [al 
题 16. 2 出 自 Chien 和 Sinclair(2011) 。Skopalik 和 V6cking(2008) 证 明了 如 果 定 理 16. 3 中 
的 任何 一 个 假设 被 放弃 ， 那 么 = 最 优 反应 动力 学 将 会 需要 指数 轮 数 收敛 (与 在 每 一 轮 中 
选择 哪个 智能 体 和 策略 无 关 )。Mirrokni 和 Vetta(2004) 首 次 提出 最 优 反应 动力 学 生成 的 
局 热 序列 的 近似 上 界 。 定 理 16. 6 来自 Roughgarden(2015)， 此 结论 受 启 发 于 Awerbuch 
等 (2008) 。 问 题 16. 1 和 16. 3 分 别 出 自 Even-Dar 等 (2007) 和 Milchtaich(1996) 。 
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练习 16. 4 


问题 


问题 16. 1 


问题 16. 2 
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CH) 给 出 一 个 存在 PNE 的 博弈 以 及 一 个 初始 局 势 ， 使 得 最 优 反 应 动力 学 
无 限 循环 。 

考虑 一 个 单元 自私 路 由 博弈 (12.4 节 )， 网 络 中 共有 m 条 边 并 且 代价 函数 
定义 在 集合 {L，2，3，…， 互 } 上 。 证 明 最 优 反应 动力 学 最 多 在 mH 轮 内 
收敛 到 一 个 PNE。 

泛 化 排序 的 势 博 弈 是 指 一 个 代价 最 小 化 博弈 ， 在 此 博弈 中 存在 一 个 泛 化 
排序 的 势 函 数 V 满足 对 局 势 s， 智能 体 i 以 及 s;， 只 要 CC，S-) 去 
GORA 亚 (s; ，s_;) 二 YW(s)。 扩 展 命 题 16. 1 到 泛 化 排序 的 势 博弈 。 
CH) 证 明 练 习 16. 3 的 反 命题 : 对 任意 初始 局 势 以 及 每 一 轮 中 有 利 的 策略 
改变 ， 如 果 最 优 反 应 动力 学 总 是 收敛 到 一 个 PNE， 那 么 此 博弈 实现 了 一 
个 泛 化 排序 的 势 函 数 。 


问题 12. 3 介绍 了 一 类 代价 最 小 化 博弈 ， 其 中 每 个 智能 体 i 二 1，2,…, k 
都 有 一 个 正 权 值 w， 并 且 每 个 智能 体 都 会 在 m 个 相同 的 机 器 里 选择 一 台 
用 于 最 小 化 其 工作 量 。 考 虑 如 下 限制 型 最 优 反应 动力 学 : 





最 大 赋 权 最 优 反 应 动力 学 
只 要 当前 局 势 s 不 是 一 个 PNE: 
在 所 有 存在 有 利 策略 改变 的 智能 体 中 ， 用 i 表示 拥有 最 大 权 值 vw'; 
的 智能 体 并 用 s; 表示 其 对 于 s-; 的 一 个 最 优 反 应 。 
更 新 局 势 为 (s;，s_;)。 











证 明 最 大 赋 权 最 优 反应 动力 学 最 多 在 & 轮 里 收敛 到 一 个 PNE。 
(CH) 考 虑 另外 一 个 se 最 优 反应 动力 学 的 变种 。 





se- 最 优 反 应 动力 学 (最 大 相对 回报 ) 
只 要 当前 局 势 s 不 是 一 个 e-PNE: 
在 所 有 存在 e- 行 动 的 智能 体 中 ， 用 i 表示 能 够 获得 最 大 相对 代价 
下 降 








问题 16. 3 
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Ci(s) — ming es, C: (Sss) 
C;(s) 
的 智能 体 ， 并 用 8i 表示 其 对 s_; 的 一 个 最 优 反 应 。 
更 新 局 势 为 (5%! ，s_，)。 

















证 明定 理 16. 3 有 关 收 敛 轮 数 的 上 界 的 结论 也 适用 于 e- 最 优 反应 动力 学 的 
最 大 相对 回报 变种 。 

考虑 问题 16. 1 中 的 代价 最 小 化 博弈 变种 ， 其 中 每 个 智能 体 都 有 为 1 的 权 
E, 但 拥有 不 同 的 代价 函数 。 正 式 地 ， 如 果 智 能 体 i 是 使 用 机 器 7 的 7 个 
智能 体 中 的 一 员 ， 那 么 智能 体 i 在 机 器 2 上 产生 的 代价 为 c; (1)。 假 设 对 
于 固定 的 i 和 j，ci (1) 在 1 上 非 递减 。 

(a) 证 明 如 果 只 有 两 台 机 器 ,那么 最 优 反 应 动力 学 会 收敛 到 一 个 PNE, 
(b) HH) 证明 如 果 存 在 三 人 台 机 器 ,那么 最 优 反 应 动力 学 有 可 能 不 收敛 。 
(c) CH) 证 明 不 论 有 多 少 台 机 器 ，PNE 总 是 存在 的 。 
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本 章 研究 第 二 类 基本 动力 学 : 无 憾 动力 学 。 虽 然 最 优 反 应 动力 学 只 能 收敛 到 一 个 
纯 策 略 纳什 均衡 并 且 与 势 博弈 紧密 相关 ， 但 是 在 任何 有 限 博 弈 中 无 憾 动 力学 都 可 以 收 
敛 到 一 组 粗糙 相关 均衡 。 

17. 1 节 考 虑 单 决策 人 如 何 与 对 手 进行 在 线 博 弈 ， 同 时 也 给 出 无 憾 算法 的 定义 。 
17. 2 节 给 出 乘 性 权重 算法 ， 并 在 17. 3 节 中 证 明 它 是 一 个 无 憾 算法 。17.4 节 定 义 了 多 
智能 体 博 弈 中 的 无 憾 动力 学 并 且 证 明了 此 动力 学 会 收敛 到 一 组 粗 烟 相 关 均 衡 。 


17.1 在 线 决策 


17. 1.1 模型 


考虑 一 个 含有 ?之 2 个 行动 的 集合 A 以 及 一 个 时 间 域 T 之 1， 这 两 个 参数 对 决策 
者 来 说 都 是 事先 已 知 的 。 例 如 ，A 可 以 代表 不 同 的 投资 策略 或 是 从 家 到 公司 不 同 的 鸭 
车 路 线 。 在 多 智能 体 博弈 中 (17.4 节 )， 行 动 集合 代表 单个 智能 体 的 策略 集 ， 而 每 个 
行动 所 产生 的 结果 则 是 由 所 有 其 他 智能 体 选 择 的 策略 来 决定 。 

考虑 如 下 场景 。” 








在 线 决策 

在 每 一 个 时 间 点 + 二 {1，2，…， TF: 

决策 人 选择 一 个 行动 集 A 上 的 概率 分 布 p'。 

对 手 选 择 一 个 代价 向 量 c': A 一 [一 1,，1j]。 

根据 分 布 p， 选 择 一 个 行动 a4， 产生 一 个 代价 dla), 
决策 人 学 习 代 价 ce， 即 整个 代价 向 量 。S 








本 文中 ,“ 在 线 ” 意 味 着 决策 人 必须 在 不 知道 未 来 的 情况 下 做 出 一 系列 的 决策 。 

把 代价 扩展 到 区 间 [ 一 cmsx，cmaxj 的 场景 详 见 练习 17. 1。 

本 章 中 的 结论 可 以 应 用 于 老虎 机 模型 中 (会 得 到 稍 许 差 一 点 的 结论 以 及 更 复杂 的 算法 )。 在 老虎 机 问 
题 中 ， 决 策 者 只 学 习 选 定 行动 的 代价 。 


® © O 
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一 个 在 线 决策 算法 在 时 间 点 上 上 确定 了 一 个 概率 分 布 如， 此 概率 分 布 是 前 :一 1 步 
里 的 代价 向 量 c ，…，c 一 以 及 实际 行动 w，…，a 一 的 函数 。 在 算法 A 中， 对手 在 
时 间 点 + 上 确定 了 一 个 代价 向 量 c， 此 向 量 是 前 t 步 里 的 概率 分 布 p' ，…，p' 以 及 前 
1 一 1 步 里 的 实际 行动 a ，…，a”' 的 函数 。 我 们 通过 遇 到 最 坏 对 手 的 期 望 代价 (基于 
实际 行动 ) 来 评估 一 个 在 线 决策 算法 的 性 能 。 模 型 里 允许 负 代价 的 存在 ， 其 可 被 建 模 
为 决策 人 的 收益 。 


17.1.2 定义 和 示例 


在 本 节 里 ， 我 们 寻找 一 个 “好 ”的 在 线 决策 算法 。 不 过 上 述 场景 看 起 来 有 些 不 太 
公平 。 对 手 可 以 在 决策 人 定好 概率 分 布 p' 后 再 选择 代价 向 量 c*。 在 如 此 不 对 称 的 情 
形 下 ， 我 们 又 能 得 到 什么 有 保证 的 结果 呢 ? 本 节 给 出 三 个 示例 用 以 表述 此 场景 下 的 种 
种 限制 。 

第 一 个 例子 表明 我 们 不 可 能 获得 和 离线 最 优 行动 序列 相近 似 的 总 代价 。 也 就 是 说 
基准 > min c(a) KRT. 

例 17. 1( 与 最 优 行动 序列 相 比较 ) 假设 A 二 {1，2)， 并 固定 一 个 在 线 决策 算法 。 
在 每 一 天 t+， 对 手 按 如 下 步 又 选择 代价 向 量 |: 假设 算法 选择 一 个 概率 分 布 p', wR 
在 此 分 布下 选择 行动 ] 的 概率 至 少 是 1/2， 那 么 令 c' 二 (1，0); 否则 的 话 令 ASO, 
1)。 这 样 的 对 手 将 强制 使 得 算法 得 到 的 期 望 代 价 至 少 为 T/2， 然 而 在 事先 知晓 代价 向 
Ec 下 ， 最 优 行动 序列 会 产生 0 的 代价 。 

例 17. 1 催生 出 如 下 重要 的 定义 。 与 其 把 在 线 算 法 的 期 望 代 价 与 离线 的 最 优 行动 
序列 的 期 望 代价 相 比 ， 还 不 如 把 它 和 在 离线 下 选择 某 一 固定 行动 产生 的 代价 相 比 。 也 


就 是 说 ， 我 们 把 基准 `) minseac'(a) 替换 为 minea >)c (la). 
定义 17. 2( 遗 憾 ) AeEAM AB. oo. cl. RER) a, oe, a FEHR 
1 - t t H - t 
FLU (a!) — min Dic (a) | (17.1) 
定义 17. 1 有 时 被 称 为 外 部 遗憾 98 。 第 18 章 会 讨论 一 个 更 严谨 的 概念 交换 遗憾。 
定义 17. 3( 无 憾 动 力学 ) 称 一 个 在 线 决 策 算 法 4 是 无 憾 的 如 果 对 于 任意 E 二 0， 


都 存在 一 个 充分 大 的 时 间 域 二 T(e) 使 得 对 算法 A 中 的 任意 对 手 ， 定 义 在 17. 1 中 的 
遗憾 最 多 为 e( 在 所 有 实施 的 行动 上 求 期 望 )。 





晶 ” 此 值 可 为 负数 , 但 是 在 遇 到 最 坏 对 手 的 时 候 其 一 定 为 正 ( 例 17. 5)。 
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定义 17. 3 中 , 行动 的 数目 是 固定 的 并 且 时 间 域 趋向 于 无 穷 。° 

本 章 采用 17. 3 定义 的 无 憾 标 准 来 作为 设计 在 线 决策 算法 的 目标 。 采 用 它 的 第 一 
个 原因 是 通过 简单 自然 的 学 习 算 法 (17; 2 节 ) 就 能 达到 此 目标 。 第 二 个 原因 是 这 个 目 
标 并 不 是 平凡 的 : 通过 接 下 来 的 例子 我 们 可 以 清楚 地 看 到 ， 需 要 一 些 技巧 才能 实现 此 
目标 。 第 三 个 原因 是 当 过 渡 到 17.4 节 中 的 多 智能 体 博弈 时 ， 此 无 憾 标准 可 以 直接 对 
应 为 达到 粗糙 相关 均衡 的 条 件 ( 定 义 13. 5)。 

一 个 自然 的 在 线 决 策 算法 是 跟风 (Follow-The-Leader，FTL) 算 法 : 在 每 一 个 时 


间 点 :， 选 择 最 小 化 累积 代价 Ye 的 行动 a。 下 面 的 例子 表明 PTL 不 是 一 个 无 居 


算法 。 更 一 般 地 ， 此 例 也 排除 掉 了 任何 确定 性 的 无 憾 算法 。 

例 17. 4( 随 机 化 是 无 憾 的 必要 条 件 ) 固定 一 个 确定 性 在 线 决策 算法 。 在 每 一 个 
时 间 点 1z， 算 法 选 定 一 个 行动 a。 显然 对 手 的 策略 是 把 此 行动 的 代价 设置 为 1， 把 
其 他 行动 的 代价 设置 为 0。 最 终 ， 此 算法 的 代价 为 然而 离线 下 最 优 行动 产生 的 
代价 为 T/n。 尽 管 只 有 两 个 行动 ， 对 于 任意 大 的 丁 来 说 ， 算 法 的 最 差 遗 憾 至 少 为 
1/2, 

针对 随机 算法 ， 接 下 来 的 例子 说 明 随 着 工 的 增长 ， 遗 憾 的 变化 是 有 限 的 。 

例 17. 5( 遗 憾 的 Vinn/T 下 界 ) 假设 有 两 个 行动 (2 一 2)， 对 手 独立 且 随 机 地 选择 
代价 向 量 c 为 (1，0) 或 (0，1)。 不 管 一 个 在 线 算 法 有 多 聪明 或 者 多 策 ， 对 于 这 种 随 
机 选择 的 代价 向 量 ， 它 在 每 一 步 的 期 望 代 价 必 然 是 1/2. 其 期 望 累 积 代价 为 T/2。 而 
离线 下 最 优 固定 行动 的 期 望 累 积 代价 仅 为 /2 一 VT， 其 中 6 是 与 独立 的 常数 。 
此 结果 来 自 于 如 下 事实 : 如 果 一 个 硬币 公平 的 投 挪 次 ， 那 么 正面 朝 上 的 期 望 次 数 
为 T/2， 标 准 差 为 (1/2)VT。 

固定 一 个 在 线 决 策 算 法 A， 一 个 随机 代价 向 量 会 使 得 算法 AHMAR MREY A 
bp/VT， 其 中 期 望 定义 在 所 有 随机 代价 向 量 和 所 有 行动 实现 上 。 并 且 至 少 存 在 一 个 代 
价 向 量 ， 和 此 对 手 博 弈 的 话 ， 算 法 A 至 少 获得 b/VT 的 遗憾 (在 所 有 实施 的 行动 上 求 
期 望 ) 。 

类 似 的 结论 表明 ， 对 于 nn 个 行动 ， 在 线 决策 算法 的 期 望 遗 憾 的 减少 程度 不 会 超过 
b Vinn/T， 其 中 65 这 0 是 独立 于 n 和 TT 的 常数 (问题 17. 1). 


17.2 乘 性 权重 算法 


本 章 最 重要 的 结论 是 存在 无 憾 工 法 。 在 第 18 章 中 ,我 们 将 表明 仅仅 是 此 结论 都 





O 严格 来 讲 ， 定 义 17.3 考虑 了 一 类 在 线 决策 算法 ， 其 中 在 行动 集 A 固定 的 情况 下 ， 每 个 了 对 应 于 一 个 
实例 。 对 于 决策 人 事先 不 知道 了 的 场景 ,参见 备注 17. 8 和 练习 17. 2. 
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有 一 些 非常 棒 的 结果 。 更 好 的 结论 是 甚至 存在 简单 自然 的 无 憾 算 法 。 虽 然 此 算法 不 是 
人 们 行为 的 一 个 完全 描述 , 但 是 算法 背后 的 指导 原则 在 人 们 学 习 和 做 决策 中 都 能 找到 
影子 。 针 对 最 差 情 况 下 的 期 望 遗 憾 ， 接 下 来 要 讨论 的 算法 是 最 优 的 。 此 结论 与 例 
17. 5 中 的 下 界 最 多 只 有 常数 级 差异 。 

定理 17. 6( 无 憾 算法 存在 性 ) 对 于 包含 nn 个 行动 的 集合 A 以 及 一 个 时 间 域 之 
dnn, 存在 一 个 在 线 决 策 算法 使 得 对 于 任何 对 手 ， 算 法 的 期 望 遗 憾 最 多 为 
2 Vin n/T. 

一 个 直接 的 推论 是 : 使 得 期 望 遗憾 下 降 到 一 个 小 的 常数 所 需要 的 步骤 数 仅 仅 是 行 
动 个 数 的 对 数 函 数 。 

推论 17. 7( 对 数 级 步骤 数 已 足够 ) 对 任意 e€E (0, 1], nn 个 行动 的 集合 A 以 及 时 
间 域 TT 三 (4ln n)/e*， 存 在 一 个 在 线 决策 算法 使 得 对 于 任意 对 手 ， 期 望 遗憾 最 多 为 e。 

特别 地 ， 定 理 17.6 和 推论 17.7 里 的 结论 可 由 乘 性 权重 (Multiplicative Weight, 
MW) 算 法 获得 2 。 此 算法 的 设计 遵循 如 下 两 个 指导 原则 。 








无 憾 算法 指导 原则 
1. 行动 的 先前 结果 应 该 指导 每 一 步 中 的 行动 选择 策略 ， 并 且 一 个 行动 被 选择 的 概 
率 与 其 累积 代价 成 反比 。 
2. 选择 一 个 差 行动 的 概率 应 该 以 指数 级 减少 。 





第 一 个 指导 原则 对 获得 无 憾 算 法 来 说 至 关 重要 ， 第 二 个 指导 原则 能 够 使 得 算法 获 
得 最 优 的 无 憾 界 。 

MW 算法 为 每 一 个 行动 维护 一 个 权重 ， 类似 “可 信 性 ”。 在 每 一 个 时 间 步 骤 里 ， 
算法 按 与 当前 权重 成 比例 的 概率 选择 一 个 行动 。 





乘 性 权重 算法 (MW 算法 ) 
对 任意 a€EA， 初 始 化 w'(a) 二 1 
for 每 一 个 时 间 步 又 1 二 1, 2, =, T do 


令 行 动 分 布 p =w, APT = >) w'(a) 为 所 有 权重 和 
ua€A 





给 定 代 价 向 量 <， 对 每 一 个 行动 aEA, 使 用 公式 zz (a)—w' (la) 
(1 一 we'(a)) 更 新 权重 











O 此 算法 的 变种 在 历史 上 被 多 次 重新 发 现 ， 见 说 明 。 
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例如 ， 如 果 所 有 可 能 的 代价 是 一 1、0 或 者 1， 那 么 每 个 行动 a 的 权重 要 么 维持 不 
变 ( 如 果 c'(a)=0), 要 么 乘 以 1 一 (如果 ca) =D 1+ yn MR ca) 一 一 1) 。 参 数 ) 
有 时 被 称 为 “学 习 率 ”， 是 介 于 0 和 1/2 的 一 个 值 。 在 定理 17. 6 证 明 的 结尾 部 分 会 具 
体 给 出 了 的 值 ， 其 为 和 了 的 函数 。 当 7 接近 0 时， 分 布 p 接近 于 均匀 分 布 ， 因 此 
较 小 的 7 鼓励 探索 ; 当 了 趋向 于 1 的 时 候 ， 分 布 p' 更 偏向 于 选择 到 目前 为 止 累 积 代 
价 最 小 的 行动 ， 因 此 较 大 的 7 了 鼓励 开发 。 此 参数 用 于 调节 探索 和 开发 过 程 。MAW 算法 
实现 起 来 很 简单 ， 唯 一 的 要 求 是 需要 为 每 个 行动 维持 一 个 权重 。 


17.3 定理 17.6 的 证 阴 


17.3.1 适应 型 对 手 与 非 适应 型 对 手 


给 定 一 个 在 线 决 策 算 法 (17. 1 节 )， 如 果 代 价 向 量 依赖 于 前 上 一 1 步 里 的 信息 ， 
那么 称 这 样 的 对 手 为 适应 型 对 手 。 非 适应 型 对 手 在 算法 开始 即 在 任何 行动 被 执行 之 
前 ， 就 已 经 明确 了 每 一 步 里 的 代价 向 量 客 ，…，c- 。 

为 了 证 明定 理 17.6， 我 们 仅 需 要 考虑 非 适 应 型 对 手 。 原 因 是 MW 算法 执行 过 
程 中 的 步骤 与 已 经 实现 的 行动 无 关 ， 因 为 算法 在 每 一 步 里 选择 的 分 布 pr 是,，… 
中 的 确定 性 函数 。 因 此 ， 为 了 最 大 化 MW 算法 的 期 望 遗憾 ， 一 个 对 手 不 会 根据 当 
前 步骤 里 的 行动 来 确定 代价 向 量 。 类 似 地 ，MW 算法 里 的 对 手 也 不 需要 根据 户 ， 
…，p' 来 刻画 代价 向 量 c， 因 为 这 些 分 布 由 自己 先前 的 代价 向 量 c ，…，c 唯一 
确定 。 


17.3.2 Spa 

给 定 大 小 为 n 的 行动 集 A 以 及 一 个 时 间 域 TAn n。 同 时 固定 一 个 非 适 应 型 对 
F, MAS OE TIRES cl, oe, cl. FADS. 这些 也 进而 确定 了 在 MW 
算法 里 使 用 的 概率 分 布 pr ，…，p'。 在 MW 算法 里 , 卫 ' = 》) w'(a) 表示 在 时 间 点 1 
开始 时 的 权重 之 和 。 证 明 的 路 线 是 把 我 们 关心 的 两 个 量 ，MW 算法 的 期 望 代 价 和 最 
优 固定 行动 的 期 望 代价 , SPUET KREK. 

第 一 步 我 们 首先 说 明 权重 和 将 会 与 算法 中 的 期 望 代 价 共同 演进 (用 到 MW 算法 
的 特性 )。 用 v 表示 MW 算法 在 时 间 点 上 时 的 期 望 代价 ， 即 


v= Dp'(a) + (a) = enw (a) (17. 2) 
a€ a 


acA 


我 们 需要 求 出 所 有 w 之 和 的 上 界 。 
为 了 理解 T"' 是 作为 T' 和 期 望 代价 的 函数 (17.2)， 我 们 有 
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pec Shen Ca) 
aba 
= S)w'(a) (1— yc'(a)) 
ag A 


= eii =y) (17.3) 

为 了 便于 分 析 ， 我 们 会 从 上 式 中 得 
出 书生 的 界 。 由 于 对 所 有 实数 r lars 
gn 17.1)， 因 此 我 们 有 TI”' 声 
jk ， 进 而 我 们 有 


A v Aa N % 


hs p- PTTer 
oe (17.4) 
第 二 步 ， 我 们 证 明 如 果 有 一 个 好 的 
固定 行动 , 那么 ,在 Fr 中， 此 行动 的 
权重 所 占 的 比例 会 很 大 。 这 也 就 表明 了 
如 果 所 有 固定 的 行动 都 是 差 的 ， 那 么 算 KML 对 所 有 实数 +， 不等式 1+ Se 成 立 
法 只 能 产生 很 大 的 代价 。 





{= o = N w 


N i 
‘ 


-15 -1 -05 D 0.5 1 1:5 2 


用 OPT 表示 经 由 最 优 固定 行动 a* 造成 的 累积 代价 >)c (a" ) 。 那 么 ， 由 于 权重 


非 负 ， 我 们 有 
yr = mit (a * ) 
T 


= | = 
w! (a Ifa qc la’ )) (17.5) 


再 一 次 使 用 指数 函数 近似 表达 cm 这 次 使 用 如 下 式 子 。 图 17. 1 指出 当 z 接近 
0 的 时 候 ， 这 两 个 函数 会 很 接近 。 我 们 可 以 通过 泰勒 展开 式 进 行 更 精确 地 表达 


Inkl ==) es pm ie a nt 


假设 |z| 三 1/2， 把 展开 式 里 除了 前 两 项 外 的 项 全 去 掉 ， 然 后 把 第 二 项 翻 倍 用 以 
补偿 删 去 的 项 ， 由 此 可 得 一 x 一 x 的 一 个 下 界 In(1 一 +)。 因 此 对 于 |z| 二 1/2， 有 1 一 
rze” 

由 于 ;wy 和 1/2 UR |e )|<1, 我 们 可 以 把 此 下 界 和 式 (17. 5) 结 合 起 来 得 到 

r> Ile gla" xa” ¥? Ss eo 7OPT T (17. 6) 
其 中 对 于 任意 t 我 们 用 到 了 粗略 估计 < a` PSL 


通过 式 (17.4) 和 式 (17. 6), 我 们 把 MW 算法 里 的 累积 期 望 代价 D v 通过 中 间 





量 P 5 OPT 里 的 累积 代价 连接 起 来 了 : 
i a EE >r > eo OPT=7 T 
两 边 取 自 然 对 数 然后 除 以 一 7 可 得 
dv < opr + yr +l (17.7) 

最 后 ， 我 们 考虑 如 何 确定 自由 变量 在 式 (17.7) 里 有 两 个 误差 项 ， 第 一 个 对 应 于 
失 准 学 习 (7 越 大 此 值 越 大 )， 第 二 个 对 应 于 过 度 学 习 (7 越 小 此 值 越 大 )。 为 了 平衡 这 两 
项 ， 我 们 选择 y= V (ln n/T. AA T>4hn n, 有 1/2， 符合 要 求 。 由 此 可 得 MW 算 
法 的 累积 期 望 代价 最 多 比 最 优 固定 行动 的 累积 代价 多 2 VT In n。 定 理 17. 6 证 明 完 毕 。 

备注 17. 8( 未 知 时 间 域 ) 上 述 证 明 里 的 了 需要 假设 时 间 域 了 事先 已 知 。 对 MW 
算法 进行 少量 改动 ， 我 们 也 能 确定 此 算法 在 了 提前 未 知 下 的 期 望 遗憾 ， 此 时 定理 
17.6 中 的 系数 2 会 被 替换 为 一 个 稍 大 的 数 (练习 17. 2)。 


17.4 无 憾 与 粗糙 相关 均衡 


现在 我 们 从 单 智能 体 扩展 到 多 智能 体 场 景 ， 研 究 有 限 博 弈 中 的 无 憾 动力 学 。 


17.4.1 无 憾 动 力学 


我 们 以 代价 最 小 化 博弈 (13. 1. 1 节 ) 为 例 来 描述 无 憾 动力 学 。 此 例 和 收益 最 大 化 
博弈 类 似 ， 只 要 把 收益 看 成 负 的 代价 即 可 。 








无 憾 动力 学 
对 任意 时 间 点 c=1, 2, «+, T: 
每 个 智能 体 守 使 用 无 憾 算法 独立 地 选择 一 个 混合 策略 pi( 每 个 具体 的 行动 对 应 
于 一 个 纯 策略 )。 
每 个 智能 体 ii 获 得 一 个 代价 向 量 ci， 给 定 其 他 管 能 体 混合 策略 ，ci(s;) 为 选择 
oh Fe ws; 时 的 期 望 代价 : 





ils) = Eg t, EECA 
其 中 o ;为 Ile: 9 
JF! 








例如 ， 如 果 每 个 智能 体 都 使 用 MW 算法 ， 那么 在 每 一 轮 中 ， 每 个 智能 体 只 是 简 
单 地 更 新 每 个 纯 策 略 的 权重 。 在 本 例 下 ， 如 果 每 个 智能 体 有 最 多 个 策略 并 且 代 价 属 
于 [一 cwwx，cCmax ]， 那 么 无 憾 动 力学 仅 需 要 运行 (4c%ln n)/e 轮 就 能 使 得 所 有 智能 体 的 
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期 望 代价 不 超过 e( 见 定理 17.6 和 练习 17.1). 


17.4.2 收敛 到 粗糙 相关 均衡 


一 个 结果 虽然 简单 却 很 重要 : 无 憾 动力 学 中 ,多 智能 体 共同 演化 历史 的 时 间 平 

均 将 收敛 到 一 组 粗糙 相关 均衡 (均衡 概念 层级 结构 中 的 最 大 集合 (定义 13.5))。 这 个 
结论 在 静态 均衡 概念 和 自然 的 学 习 动 力学 的 输出 之 间 建 立 了 基本 的 联系 。 

命题 17. 9( 无 憾 动 力学 收敛 到 CCE) 假设 在 运行 本 轮 无 憾 动力 学 后 ， 代 价 最 小 


化 博弈 里 的 每 个 智能 体 i 一 1，2，…, 上 都 有 不 超过 6 的 期 望 代价 。 用 of = [pa 
在 第 上 轮 时 的 联合 行动 分 布 ， 并 用 一 a D 表示 这 些 联合 行动 分 布 的 时 间 平 均值 。 
那么 5 在 如 下 意义 下 为 一 个 近似 粗糙 相关 均衡 ， 对 任意 的 Hi 的 策略 改变 s;!， 有 


E,..(C;(s)] < E,_.[C;(s: »s-;) ]+e (17. 8) 
证 明 : 由 go 的 定义 可 知 ， 对 任意 智能 体 i， 都 有 
` 
a =? 
E,_,[C.(s)] = TOE [LC;(s)] (17.9) 
以 及 
了 
1 od 
E,.,[C;(s' ss.) ] = TOP Es 六 (17. 10) 


式 (17.9) 和 式 (17.10) 的 右 端 项 分 别 为 智能 体 i 在 每 一 轮 中 按照 无 憾 算 法 和 固定 
策略 s; 行动 时 的 时 间 期 望 代价 。 由 于 每 个 智能 体 的 遗憾 不 超过 se<， 那么 前 项 最 多 比 后 
项 多 se。 因此 满足 近似 粗糙 相关 均衡 的 条 件 (17. 8) 。 m 

命题 17. 9 给 人 一 种 感 党 ， 粗 糙 相 关 均 衡 概 念 是 一 种 特殊 的 计算 简单 的 概念 ， 因 
此 可 以 作为 智能 体 行为 的 相对 合理 的 预测 。 


17. 4.3 结束 语 


在 对 粗糙 相关 以 及 相关 均衡 惯常 的 理解 中 ， 需 要 一 个 第 三 方 来 从 均衡 分 布 里 抽样 
一 个 局 势 (13. 1 节 )。 命 题 17.9 则 展示 了 这 种 相关 性 是 如 何 从 相互 独立 的 智能 体 之 
间 的 重复 博弈 中 内 生出 来 的 。 其 实 这 种 相关 性 本 质 上 来 源 于 共享 的 博弈 历史 。 
命题 17. 9 中 的 近似 均衡 概念 考虑 了 可 列 加 的 误差 ， 然 而 定义 14.5 和 16. 2 使 用 
了 相关 误差 。 这 样 做 的 原因 是 为 方便 分 析 。 


无 憾 动 力学 的 一 个 候选 形式 是 在 每 一 轮 里 根据 分 布 s = Ile 抽样 出 一 个 结果 
s'， 其 中 智能 体 i 收 到 一 个 代价 向 量 c HIER s ES, A cls) =G Css, 


日 ”可 以 理解 为 多 智能 体 联合 行动 髓 率 分 布 的 时 间 平 均值 ， 译 文保 持原 著 的 字面 翻译 。 
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s). HE c 为 抽样 结果 集 {8 ，…，s') 的 均匀 分 布 时 ， 与 命题 17. 9 相 类 似 的 结论 
也 成 立 ， 不 过 在 证 明和 描述 过 程 中 需要 把 抽样 误差 考虑 进去 。 在 这 些 候选 动力 学 
里 ， 当 面 对 适应 型 对 手 (17. 3.1 节 ) 时 ， 智 能 体 使 用 无 憾 算 法 这 个 条 件 是 必 不 可 
少 的 。 

在 第 14 章 里 ,我 们 证 明了 (X，y)- 平 滑 博弈 (定义 14. 2) 的 POA 界 对 所 有 粗糙 相 
关 均 衡 都 成 立 ( 定 理 14.4)， 并 且 在 近似 均衡 里 会 温和 退化 (定理 14.6)。 因 此 ， 命 题 
17. 9 似乎 表明 此 POA 界 应 该 也 适用 于 无 憾 动力 学 里 的 时 间 平 均 期 望 目标 函 数值 。 实 
际 上 也 确实 如 此 (练习 17. 3)。 

推论 17. 10 (无 憾 动力 学 的 POA 界 ) EARD HF THE, RRA. p+ 


k 
滑 博弈 里 的 每 个 智能 体 ( 共 上 个 ) 都 有 不 超过 的 期 望 遗 憾 。 用 or = [| p' 表示 在 第 1 
轮 里 的 联合 行动 分 布 并 用 8 AERKAR, MAH 


À cost(s* ) + = 
d= 下 一 及 








了 
FDE [cost(s) ]< 
t=1 


当 e->0 时 ， 上 述 结果 收敛 到 [平滑 博弈 的 标准 POA 界 (14.4 节 )。 


总 结 


© 在 线 决策 算法 的 每 一 时 间 步 又 里 ， 算 法 首先 选择 一 个 在 行动 上 的 分 布 ， 然 后 
对 手 公布 针对 每 个 行动 的 代价 。 

e 一 个 行动 序列 的 遗憾 定义 为 此 序列 的 时 间 平 均 代 价 与 最 优 固定 行动 产生 的 时 
间 平 均 代 价 之 差 。 

e 无 憾 算 法 能 够 保证 当时 间 TT 趋向 于 无 穷 时 ， 期 望 遗憾 趋向 于 0。 

© 乘 性 权重 算法 是 一 个 简单 的 无 憾 算 法 ， 并且 此 算法 在 最 差 情 况 下 的 期 望 遗憾 
是 最 优 的 。 

© 在 无 憾 动力 学 的 每 一 轮 里 ， 每 个 智能 体 都 独立 地 使 用 一 个 无 憾 算法 选择 一 个 
混合 策略 。 

e 无 憾 动 力学 里 联合 行动 历史 的 时 间 平 均 会 收敛 到 一 组 粗糙 相关 均衡 。 

e 平滑 博弈 里 的 POA 界 适用 于 由 无 憾 动力 学 产生 的 时 间 平 均 期 望 目标 函数 值 。 


说 明 


乘 性 权重 算法 的 众多 版 本 以 及 定理 17. 6 来 自 Cesa-Bianchi 等 (2007)。Cesa-Bian- 
chi 和 Lugosi(2006) 以 及 Blum 和 Mansour(2007b) 讨 论 了 许多 变种 和 扩展 ， 包 含 老虎 
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机 模型 (决策 者 在 每 一 时 间 点 上 只 学 习 选 择 行动 的 代价 )。 上 述 文章 ， 以 及 Foster 和 
Vohra(1999), Arora % (2012), 涵盖 了 在 线 决策 算法 、 无 憾 算法 、 乘 性 权重 算法 的 
先导 版 本 (比如 “随机 加 权 多 数 法 ”和 “障碍 法 ”) 等 的 历史 。 一 些 关键 的 参考 文献 包 
含 Blackwell(1956), Hannan(1957), Littlestone 和 Warmuth(1994)， 以 及 Freund 
和 Schapire(1997) 。Hannan(1957) 暗含 了 命题 17.9。 问 题 17.2 和 17.4 分 别 出 自 
Littlestone(1988) 以 及 Kalai 和 Vempala(2005) 。 


练习 


练习 17.1 


练习 17.2 


练习 17.3 
练习 17. 4 


问题 


问题 17. 1 


问题 17. 2 


CH) 把 推论 17. 7 扩展 到 在 线 决策 问题 上 ， 并 把 [一 1，1] 的 行动 代价 区 间 
替换 为 [一 cm ，cnax]( 所 需 时 间 步 又 数 减少 Cha FF) 。 假 设 cwx* 的 值 是 事先 
已 知 的 。 

(HH) 乘 性 权重 算法 需要 用 已 知 的 时 间 域 全 来 设置 学 习 率 7”。 修 改 算法 使 其 
不 需要 T 作为 已 知 信息 。 对 任意 大 的 工 以 及 任意 对 手 ， 修 改 后 的 算法 应 
BARE b V (In n)/T 的 期 望 遗 憾 ， 其 中 5 二 0 是 与 六 和 T 无 关 的 常数 。 
(CH) 证 明 推 论 17. 10。 


命题 17.9 证 明了 由 无 憾 动力 学 生成 的 时 间 平 均 联 合 行动 分 布 二 of 是 
一 个 近似 粗粮 相关 均衡 ,但 是 它 并 没有 给 出 在 第 + 轮 中 输出 分 布 e' 的 任何 


信息 。 证 明 分 布 c: 是 一 个 近似 粗糙 均衡 当 且 仅 当 它 是 一 个 近似 纳什 均衡 
(使 用 相同 的 可 加 误差 项 ) 。 


考虑 一 个 含有 好 个 行动 的 在 线 决策 问题 。 证 明 一 个 在 线 决 策 算法 在 最 差 
情况 下 的 期 望 遗 憾 不 可 能 以 超过 5 Cn ”7 的 速度 训 减 ， 其 中 ooo 是 
Ej n 和 T 工 无 关 的 常数 。 

考虑 一 个 在 线 决策 问题 。 其 中 及 个 “专家 ”。(n 是 2 MRKI). 





结合 专家 建议 
在 每 一 个 时 间 点 1 二 1]，2，…，, 丁 中 执行 : 
每 个 专家 给 出 一 个 针对 二 值 事 件 的 预测 (例如 ， 股 票 是 涨 还 是 跌 )。 
决策 者 选取 一 个 对 事件 具体 实现 (0 或 者 1) 的 分 布 p'。 
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公布 事件 的 具体 实现 r" E {0，1)。 
根据 分 布 p 选择 一 个 事件 输出 ， 如 果 输 出 与 不同， 称 发 生 了 


一 个 错误 。 








假设 有 一 个 先知 型 的 专家 ， 其 在 每 一 轮 里 都 做 出 了 正确 的 预测 。 
(a) 〈H) 一 个 确定 性 算法 总 是 在 之 中 把 0 或 1 的 概率 置 为 1。 证 明 在 一 个 
确定 性 算法 中 ， 最 差 情况 下 错误 数量 界 的 最 小 值 一 定 是 logsn。 
(b) 证 明 对 于 任意 一 个 随机 化 算法 ， 存 在 一 个 专家 预测 序列 和 事件 实现 ， 
算法 中 错误 数量 的 期 望 值 至 少 为 (1/2)logsn。 
(c)(H) 证 明 存 在 一 个 随机 化 算法 ， 对 于 任意 一 个 专家 预测 序列 和 事件 实 
现 ， 错 误 数量 的 期 望 值 最 多 为 5 logon, FE b<1 为 一 个 独立 于 nn 的 
常数 。b 最 小 能 取 多 少 ? 
问题 17.3 〈H) 考 虑 一 个 & 智 能 体 代 价 最 小 化 博弈 ， 甚 中 在 两 个 不 同 的 局 势 里 不 存在 
拥有 相同 代价 C;(s) 的 智能 体 i。 证 明 命 题 17. 9 的 逆 命 题 : 对 博弈 里 的 任 
意 一 个 粗糙 相关 均衡 。， 存 在 一 组 无 憾 算 法 A. A. 4 T BFK 
穷 时 ， 相 应 的 无 憾 动力 学 的 时 间 平 均 历史 收敛 到 o。 
问题 17. 4 fil 17.4 表明 了 跟风 (Follow-The-Leader，FTL) 算 法 以 及 任何 确定 性 算法 
都 不 是 无 憾 的 。 本 问题 勾勒 了 FTL 算法 的 一 个 随机 化 版 本 ， 即 扰动 跟风 
(Follow-The-Perturbed-Leader，FTPL) 算 法 。 此 算法 的 期 望 遗 憾 可 以 与 
乘 性 权重 算法 相 媲 美 。 算 法 通过 一 个 随机 化 子 程序 来 隐 式 地 定义 行动 上 
的 分 布 p'o 





扰动 跟风 (FTPL) 算 法 
for 任意 行动 wEA do 
独立 地 抽样 一 个 几何 随机 变量 (参数 72 ， 用 X. 表 示 此 变量 
for (BH A t=1, 2, =, T do 
选择 一 个 行动 a， 此 行动 能 最 小 化 到 目前 为 止 的 扰动 累积 代价 


/ | 
一 2 X, + Sie") 
u=] 








固定 一 个 非 适应 型 对 手 ， 也 即 固定 一 个 代价 向 量 序列 c ，…，cr。 为 了 


O 等 价 地 ， 以 正面 朝 上 的 概率 为 7 重复 地 掷 一 枚 硬币 ， 第 一 次 出 现 正面 所 需 的 次 数 即 为 此 变量 (包含 第 
一 个 正面 7。 
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简化 分 析 ， 假 设 在 每 一 步 : 里， 不 存在 任何 一 对 行动 的 累积 代价 只 相差 一 

个 整数 。 

(a) (ED 证 明 在 每 一 步 * 一 1，2，…， 了 里 ，! 之 前 的 最 小 扰动 累积 代价 与 
次 小 扰动 累积 代价 的 差 超过 2 的 概率 为 1 一 

(>) CH) 进行 一 场 思想 实验 ， 考 虑 一 个 (不 能 实现 的 ) 算 法 ， 在 此 算法 的 每 
-一步 + 里， 结合 当前 的 代价 向 量 挑选 一 个 最 小 化 扰动 累积 代价 — 2X, + 
Sle Ca) 的 行动 。 证 明 此 算法 的 中 全 最 多 为 max X.. 

Co) 证 明 ELmax X,J<bq ln 2， 其 中 闻 为 行动 的 个 数 ，0>0 为 独立 于 
Al 的 常数 。 

(d) (H) 证 明 对 于 一 个 合适 的 wy， 在 最 差 情况 下 ，FTPL 算法 的 期 望 遗 憾 
REH b/n n)/T, b6>0 为 独立 于 7 和 7 的 常数 。 


Ce) (H) 如 何 修改 FTPL 算法 及 其 分 析 过 程 ， 使 得 其 在 面 对 适 应 型 对 手 时 
也 能 够 获得 和 原 算法 相同 的 遗憾 值 。 
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第 17 章 证 明了 粗糙 相关 均衡 是 计算 简单 的 ， 即 在 任意 有 限 博弈 中 ， 存 在 一 些 简 
单 的 且 计 算 高 效 的 学 习 过 程 能 够 快速 收敛 到 一 组 粗糙 相关 均衡 。 不 过 当 我 们 深入 到 均 
衡 概念 层级 结构 ( 见 图 13. 1) 中 的 一 个 较 小 的 集合 时 ， 我 们 还 能 得 到 什么 结论 呢 ? 在 
18.1 节 和 18.2 节 中 ， 我 们 给 出 第 二 个 同时 也 是 更 严谨 的 有 关 遗 憾 的 概念 ， 并 且 类 似 
地 ， 使 用 此 概念 我 们 证 明 相 关 均 衡 也 是 计算 简单 的 。18. 3 节 和 18. 4 节 进 一 步 引 入 混 
合 策略 纳什 均衡 概念 ， 并 且 我 们 将 证 明 在 两 人 零 和 博弈 里 它 是 容易 计算 的 。 


18. 1 交换 遗憾 和 相关 均衡 


本 章 讨论 练习 13. 3 中 定义 的 相关 均衡 ， 其 与 定义 13. 4 等 价 。 

定义 18. 1( 相 关 均 衡 ) 如 果 对 于 任意 智能 体 iE 11，2，…，R&} 以 及 一 个 交换 函 
As: Si 一 S， 有 

Erca C: Cs) | < Erl C (6G) +84) J 
那么 称 o 为 一 个 相关 均衡 ， 其 中 o 为 代价 最 小 化 博弈 的 输出 集合 S1 XS, Xo KS, 上 
的 分 布 。 

每 一 个 相关 均衡 都 是 一 个 粗糙 相关 均衡 ， 不 过 反 过 来 一 般 不 成 立 ( 见 13. 1.6 节 )。 

我 们 要 问 是 否 存在 一 个 类 似 无 憾 动力 学 (17.4 节 ) 的 过 程 ， 此 过 程 能 收敛 到 一 组 
相关 均衡 (和 命题 17. 9 类 似 的 结论 )? 为 了 得 到 确切 的 答案 ， 我 们 需要 定义 一 个 更 合 
适 同 时 也 更 严谨 的 有 关 遗 憾 的 概念 ， 用 以 比较 在 线 决策 算法 和 事前 最 佳 交换 函数 所 产 
生 的 期 望 代 价 。 由 于 固定 行动 对 应 于 常数 交换 函数 ， 因 此 这 应 该 是 一 个 比 事先 最 佳 固 
定 行动 更 强 的 基准 。 

17.1 节 中 引入 了 如 下 在 线 决 策 问 题 模型 : 在 每 一 个 时 间 点 上 一 1， 2，…， 了 中 ， 
决策 者 确定 一 个 在 行动 集合 An 个 行动 ) 上 的 分 布 产 ， 然 后 对 手 选择 一 个 代价 函数 
c: A 一 [一 1，1]， 然 后 决策 者 根据 p 选择 一 个 具体 的 行动 a*， 并 产生 一 个 代价 
c(a‘), 

EM 18. 2( 交 换 遗 憾 ) AeKtaec, e, cl, UIRAE] a’, a’ 的 
交换 遗憾 定义 为 
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LT eta) min JJa] (18. 1) 

其 中 的 最 小 化 项 里 的 变量 为 所 有 可 能 的 交换 函数 8。 

定义 18. 3( 无 交换 遗憾 算法 ) 如果 对 于 任意 es 二 0， 存 在 一 个 充分 大 的 时 间 域 
T 一 T(e) 使 得 对 于 任意 一 个 在 线 决策 算法 4 的 对 手 ， 决 策 者 所 得 到 的 期 望 交换 遗憾 最 
多 为 s， 那么 我 们 称 算法 A 为 无 交换 遗憾 的 。 

与 定义 17. 3 一 样 ， 行动 个 数 n 是 固定 的 ， 同 时 时 间 域 全 趋向 于 无 穷 ， 并 且 人 允许 
算法 ARF T. 

在 无 交换 遗憾 动 力学 的 任意 时 间 点 + 里 ， 每 个 智能 体 i 都 独立 地 使 用 无 交换 遗 
憾 算法 选择 一 个 混合 策略 p;。 代 价 向 量 与 无 憾 动力 学 里 的 定义 一 样 ， 其 中 给 定 任意 
其 他 智能 体 j 的 混合 策略 pi 后 ，c; (5;) 为 智能 体 i 选择 纯 策 略 s ES 的 期 望 代价 。 
相关 均衡 和 无 交换 遗憾 动力 学 的 联系 与 粗糙 相关 均衡 和 无 憾 ( 外 部 ) 动 力学 的 联系 
一 样 。 

命题 18. 4( 无 交换 遗憾 动力 学 和 相关 均衡 ) 假设 在 无 交换 遗憾 动力 学 里 执行 
轮 后 ， 代 价 最 小 化 博弈 里 的 每 个 智能 体 i 二 1]，2，…, & 的 期 望 交换 遗憾 不 超过 e。 令 


k T 
d= [DREA Ri 轮 里 的 联合 行动 分 布 、 并 用 6 一 示 》) of 表示 这 些 分 布 的 时 间 历 
i=1 1=1 


史 平 均 。 那 么 go 在 如 下 意义 下 为 一 个 近似 相关 均衡 对 任意 智能 体 i 以 及 交换 通 数 
ô: S:S; 来 说 ， 都 有 
ELC(s)] S ELC (8Gs;) ssa) ] +e 

定义 18. 2~18. 3 和 命题 18. 4 的 描述 很 清晰 ， 不 过 是 否 存 在 无 交换 遗憾 算法 呢 ? 
接 下 来 的 结论 是 一 个 把 设计 无 交换 遗憾 算法 归 约 到 设计 无 外 部 遗憾 算法 的 “ 黑 盒 归 
约 ”。 

定理 18. 5( 黑 盒 归 约 ) 如 果 存 在 一 个 无 外 部 遗憾 算法 ， 那 么 就 存在 一 个 无 交 摘 
遗憾 算法 。 

结合 定理 17.6 和 18.5， 我 们 断言 无 交换 遗憾 算法 是 存在 的 。 例 如 ， 将 乘 性 权重 
算法 (17. 2 节 ) 通 过 归 约 就 会 导出 一 个 计算 高 效 的 无 交换 遗憾 算法 。 同 样 ， 我 们 知道 
与 粗糙 相关 均衡 类 似 ， 相 关 均 衡 也 会 是 计算 简单 的 。 


* 18.2 定理 18.5 的 证 明 


整个 归 约 过 程 很 自然 ， 你 能 想到 的 几乎 都 可 行 。 不 过 在 证 明 的 结束 部 分 需要 一 个 
技巧 。 





日 ”内 部 遗憾 是 一 个 紧密 的 相关 概念 。 它 的 定义 里 使 用 事前 最 佳 单 次 交换 函数 (从 一 个 行动 到 另 一 个 行 
动 )， 而 不 是 最 佳 交 换 函 数 。 一 个 行动 序列 的 交换 遗憾 和 内 部 遗憾 最 多 相差 n fo 
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REITE AS={1, 2, =, nje GM. s MER n 个 不 同 的 无 (外 部 ) 遗 憾 算 
法 ， 比 如 n 个 乘 性 权重 算法 。 每 个 算法 都 随时 准备 着 产生 一 个 在 行动 A 上 的 分 布 并 
接受 反馈 过 来 的 代价 向 量 。 大 体 来 说 ， 可 以 认为 算法 Mi 负责 防范 智能 体 从 行动 向 
其 他 行动 进行 有 利 的 策略 改变 。 为 了 方便 起 见 ， 假设 由 M; 在 时 间 点 上 上 生成 的 行动 
概率 分 布 只 依赖 于 之 前 的 代价 向 量 c ，…，c“'， 而 不 依赖 于 之 前 的 具体 实现 a' ，…， 
a”' 。 此 假设 使 得 我 们 只 需要 关注 于 非 适应 型 对 手 即 可 (17. 3. 1 节 )， 或 者 等 价 地 把 代 
价 向 量 序列 cl, oe, co 事先 固定 好 。 

如 下 的 “ 主 算 法 ”M 与 M ，…，M, 协 同 工 作 ， 另 见 图 18. 1 。 





主 算法 
fort=1, 2, +, T do 
接收 从 算法 MI ，…，AM, 中 生成 的 在 行动 集 A 上 的 概率 分 布 gf o> q 
计算 并 输出 一 个 一 致 分 布 p 
接收 对 手 的 代价 向 量 c 
反馈 给 每 个 算法 Mi ARME p G). 














图 18. 1 从 交换 遗憾 最 小 化 到 外 部 遗憾 最 小 化 的 黑 盒 归 约 


我 们 在 证 明 的 结尾 部 分 讨论 如 何 经 由 分 布 gi ，…，g; 来 计算 一 致 分 布 p'*。 这 是 整 
个 归 约 的 关键 技巧 所 在 。 在 每 一 个 时 间 点 结束 后 ， 真 实 代 价 向 量 “ 被 分 配 到 无 憾 算 
法 里 ， 并 按照 算法 的 当前 相关 性 ( 即 p'(j)) 进 行 了 缩放 。 

我 们 希望 利用 算法 Mi 提供 的 无 外 部 遗憾 特性 来 推导 出 主 算法 M 的 无 交换 遗憾 特 
性 。 首 先 我 们 看 看 利用 一 致 分 布 p ，…，p" 已 经 得 到 了 什么 以 及 还 需要 些 什么 。 
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固定 代价 向 量 序列 ，… 。 主 算法 中 的 时 间 平 均 期 望 代价 为 
Prea (18. 2) 

在 固定 一 个 交换 函数 6: A 一 A 的 情况 下 ， 时 间 平 均 期 望 代价 为 
LY Sp + e@w (18. 3) 


我 们 的 目标 是 对 于 任意 交换 函数 86， 证 明 式 (18.2) 最 多 为 式 (18.3) 再 加 上 一 个 随 
下 增 大 而 减少 的 项 ( 当 工 趋向 于 无 穷 时 ， 此 项 为 0)。 

从 任意 算法 M; 的 角度 来 考虑 。 在 Mi 中 ,行动 是 根据 推荐 分 布 gy ，…，g; 来 确 
定 并 且 真 正 的 代价 向 量 为 pC) cle oes POG) sc". Ak, FEM, 认为 它 的 时 间 
平均 期 望 代 价 为 


Te Yao e (p'(j)c'(i)) (18. 4) 

HFM, 是 一 个 无 憾 算法 ， 它 感知 的 代价 (18.4? 最 多 为 在 任 一 固定 行动 AEA 下 
的 代价 (最 多 相差 一 个 Ri ， 其 随 工 趋向 于 无 穷 而 趋向 于 0) 。 也 就 是 说 ， 式 (18.4) 的 上 
界 为 


， 
1 
FUP De (k) +R, (18. 5) 


现在 固定 一 个 交换 函数 8$。 把 式 (18.4) 和 式 (18.5) 之 间 的 不 等 式 在 ) 上 全 加 起 来 ， 
PT a CLE ETH Seon aera 得 到 


FD DD (i) (18. 6) 


=] 一] j= 


最 多 为 


LOG rn prac: : 
TÈ PCO) + DUR, (18.7) 


表达 式 (18.7) 与 式 (18. 3) 等 价 ， 最 多 相差 一 项 F R; ( 当 工 趋向 于 无 穷 时 ， 此 项 


趋 近 于 0)。 的 确 ， 通 过 把 代价 向 量 c: 分 散 到 各 个 无 外 部 遗憾 算法 M ， =, M,F, R 
们 来 保证 此 性 质 。 

最 后 ,我们 通过 选择 使 式 (18. 2) 和 式 (18. 6) 协 调 的 一 致 分 布 p'，…，p' 来 完成 
剩 下 的 归 约 部 分 。 对 任意 1. 2. =. T, 我 们 说 明 如 何 通过 选择 一 致 分 布 p' 使 得 
对 于 任意 行动 1€E A， 有 

p' (i) = FFG (18. 8) 
其 中 式 (18. 8) 的 左边 和 右边 的 部 分 分 别 是 式 (18. 2) 和 式 (18.6) 中 c (OAM KR. 


本 次 归 约 中 的 关键 技巧 是 把 等 式 (18. 8) 当 成 是 一 个 马尔 可 夫 链 的 稳 态 分 布 。 更 
精确 地 ， 给 定 算法 M ，…，M, 中 的 分 布 %，…，%， 在 时 间 点 上 上 中， 构造 如 下 马尔 
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可 夫 链 (图 18. 2) : RABAWHAH=(1, 2. -+, n}, MERI, JEA, RAS BIW 
转移 概率 为 q;(i)。 也 就 是 说 ,分布 g; 表示 了 从 状态 7 出 发 后 的 转移 概率 。 概 率 分 布 
pP 满足 式 (18. 8) 当 且 仅 当 它 是 此 马尔 可 夫 链 的 稳 态 分 布 。 由 于 至 少 存 在 一 个 这 样 
的 分 布 ， 且 可 以 使 用 特征 值 计算 方 法 高 效 地 求 出 ( 见 说 明 )。 上 述 即 完成 了 定理 18.5 
的 证 明 。 








图 18.2 用 于 计算 一 致 分 布 的 马尔 可 夫 链 


备注 18. 6( 一 致 分 布 的 解释 ) ”给 定 算法 的 推荐 分 布 gi ，…，gqh， 一致 分 布 p 的 
选择 来 自 于 证 明 的 构造 部 分 。 然 而 它 也 有 一 个 自然 的 解释 ， 即 它 可 以 看 作 一 个 选 代 决 
策 过 程 的 极限 分 布 。 考 虑 让 某 个 算法 Mi 给 出 一 个 推荐 策略 。 它 根据 它 的 分 布 %f 给 出 
了 一 个 推荐 j, 。 然 后 让 算法 Mi, 根据 分 布 g;, 给 出 推荐 策略 js， 依次 类 推 。 这 个 随机 过 
程 可 以 有 效 地 收 化 到 定理 18.5 证明 中 的 马尔 可 夫 链 的 稳 态 分 布 。 


18.3 零 和 博弈 的 最 小 最 大 化 定理 


本 章 接 下 来 把 目光 转移 到 两 个 智能 体 的 博弈 。 像 通常 一 样 ， 我 们 称 一 个 智能 体 为 
一 个 选手 ， 并 且 使 用 博弈 中 的 收益 最 大 化 体系 (备注 13. 1) 。 


18.3.1 两 人 零 和 博弈 


如 果 在 一 个 两 人 博弈 中 ， 对 于 任意 博弈 局 势 ， 一 个 选手 的 收益 始终 等 于 另 一 个 选 
手 收 益 的 负数 ， 那 么 称 此 博弈 是 零 和 的 。 这 属于 纯 竞 争 的 博弈 ， 因 为 一 个 人 的 收益 就 
等 于 另 一 个 人 的 损失 。 一 个 两 人 零 和 博弈 可 以 用 一 个 单独 的 矩阵 4 来 明确 表示 。 其 
中 两 个 选手 的 策略 组 合 对 应 于 矩阵 中 的 行 和 列 。 元 素 a; 表明 行 选手 在 输出 (i, j) EW 
收益 ， 此 也 表示 列 选 手 在 此 输出 中 的 收益 的 负数 。 因 此 ， 行 选手 和 列 选手 分 别 偏好 更 


KR PR ii HE Fo HR h RX NC EL 181 








大 和 更 小 的 数字 。 我 们 可 以 假设 所 有 的 收益 都 落 在 一 1 和 1 之 间 ， 如 果 有 必要 的 话 可 
以 再 调整 收益 范围 。 
举例 而 言 ， 如 下 矩阵 描述 了 在 石头 -剪刀 - 布 博弈 中 的 收益 (1. 3 节 )。 

















一 般 而 言 ， 纯 策略 纳什 均衡 (定义 13.2) 在 两 人 零 和 博弈 中 不 存在 ， 因 此 在 分 析 
此 类 博弈 时 ， 更 关注 于 混合 策略 纳什 均衡 (定义 13. 3)， 即 每 个 选手 根据 一 个 混合 策 
略 来 独立 随机 地 选择 一 个 行动 。 使 用 x 和 y 分 别 表示 行 和 列 的 一 个 混合 策略 。 

如 果 收 益 和 矩阵 A 是 mxXn 的 ， 并且 行 策略 是 x， 列 策略 是 y)， 那 么 可 以 把 行 选手 
的 期 望 收益 写成 


之 “YM = x™Ay® 
Bll BS iE KY hk, AL EARE A FY o OW HH CR. DER, 
其 中 对 任意 混合 行 策略 x. AXA $x A $ 以 及 对 任意 混合 列 策略 ye AA PK TAY., 


18. 3.2 最 小 最 大 化 定理 


在 一 个 两 人 零 和 博弈 里 ， 你 会 偏好 于 在 对 手 公布 他 的 混合 策略 前 或 后 公布 自己 的 
混合 策略 吗 ? 直觉 上 ， 这 是 一 个 对 先行 动 者 不 利 的 博弈 ， 因 为 第 二 个 选手 可 以 参考 第 
一 个 选手 的 策略 来 行动 。 最 小 最 大 化 定理 是 一 个 令 人 惊讶 的 结论 ， 它 表明 我 们 可 以 不 
用 关心 谁 先行 动 。 

定理 18. 7( 最 小 最 大 化 定理 ) 对 任意 两 人 零 和 博弈 A， 

max(min x™Ay) = min(max x Ay) (18. 9) 

式 (18. 9) 的 左边 表示 行 选手 先行 动 ， 列 选手 次 之 。 在 给 定 行 选手 选择 的 策略 后 ， 列 
选手 会 以 最 优 的 方式 行动 ， 并 且 行 选手 也 会 考虑 到 此 点 来 进行 行动 。 在 式 子 的 右边 ， 两 
位 选手 的 行动 顺序 刚好 相反 。 最 小 最 大 定理 断言 : 在 最 优 行动 策略 下 ， 每 个 选手 在 这 两 
种 情况 下 的 期 望 收益 是 一 样 的 。 式 (18. 9) 中 的 这 个 收益 被 称 为 博弈 A 的 价值 (value)。 

最 小 最 大 化 定理 等 价 于 如 下 描述 : 任意 两 人 零 和 博弈 都 有 至 少 一 个 混合 策略 纳什 
均衡 (练习 18.3)。 同 样 ， 它 也 表明 了 如 下 “交叉 配对 ”性 质 ( 练 习 18.4); 如 果 
(x ，y) 和 (x*,，y ) 是 两 人 零 和 博弈 中 的 混合 策略 纳什 均衡 ， 那 么 (x ， 史 ) 和 
(x?, y' the. 
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* 18.4 定理 18.7 的 证 明 


在 一 个 两 人 零 和 博弈 中 ， 先 行 总 是 不 利 的 : 对 于 先行 的 行 选手 来 说 ， 如 果 # 是 一 
个 最 优 混合 策略 ， 那 么 当 他 蚌 后 行者 时 ,zt 总 是 一 个 可 供 选 择 的 策略 。 因 此 式 (18. 9) 
的 左边 最 大 为 式 子 的 右边 。 我 们 接 下 来 关注 反方 向 的 不 等 式 。 

固定 一 个 收益 落 在 [一 1]，1j] 区 间 的 两 人 零 和 博弈 4 以 及 一 个 参数 为 seE (0，1]。 
假设 我 们 运行 足够 多 轮 (T) 的 无 憾 动力 学 (17. 4 节 )， 使 得 两 位 选手 都 有 最 多 不 超过 
的 期 望 (外 部 ?遗憾 。 例 如 ， 如 果 两 位 选手 都 使 用 乘 性 权重 算法 ， 那么 运行 T= ln 
(max{m，n})))/e 轮 就 已 经 足够 了 ， 其 中 mAn 为 矩阵 4 的 维度 (推论 17.7). ° 

分 别 用 pr ，…，p” 和 gq ，…，4 和 表示 行 选手 和 列 选手 根据 无 憾 算 法 使 用 的 混合 
策略 。 给 定 对 手 在 第 t 轮 里 的 混合 策略 ,t 轮 后 每 个 无 憾 算 法 给 出 的 收益 向 量 就 是 每 
个 策略 的 期 望 收益 。 这 也 就 意味 着 行 选手 和 列 选手 的 收益 向 量 分 别 为 44 和 (p') "A. 


令 


表示 行 选手 的 时 间 平 均 混 合 策略 ; 


表示 列 选手 的 时 间 平 均 混合 策略 ; 并 令 
u= 7A POA q 
表示 行 选 手 的 时 间 平 均 期 望 收益 。 
从 行 选手 的 角度 来 看 。 因 为 他 的 期 望 遗 憾 最 多 为 s， 那么 对 于 任意 一 个 固定 的 纯 
策略 i 的 向 量 e;， 都 有 


ag = FD elar < D or Aq' +e=v+e (18. 10) 


由 于 行 上 的 任意 混合 策略 x 都 可 以 表示 为 在 e; 上 的 概率 分 布 ， 不 等 式 (18. 10) 以 
及 其 中 的 线性 关系 意味 着 对 于 任意 混合 策略 x A 
xTAPV<Kvt+e (18. 11) 
从 列 选 手 的 角度 考虑 也 有 对 称 的 结论 ， 由 于 他 的 期 望 遗 憾 同样 不 超过 s， 这 表明 
对 于 列 上 的 任意 混合 策略 y， 我 们 有 
Pay Ss (18. 12) 


日 ERI He, REPEAL IE IE KEE SR Oh ie ve MY. HE te AE AAR OAT. Ea 
博弈 可 以 直接 过 滤 到 当前 场景 。 
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因此 ， 
max(min x' Ay) min "Ay 
x y d 
Sue (18. 13) 
> max xA f—2e (18. 14) 


> min(max x'Ay) — 2e 
其 中 式 (18. 13) 和 式 (18. 14) 分 别 来 自 式 (18. 12) 和 式 (18. 11)。 取 极限 > 0(T> 
oo) 就 完成 了 最 小 最 大 化 定理 的 证 明 。 


J 结 


e 一 个 行动 序列 的 交换 遗憾 是 指 此 序列 的 时 间 平 均 代 价 与 事先 最 佳 交 换 函 数 得 
到 的 时 间 平 均 代 价 之 差 。 

e 一 个 无 交换 遗憾 算法 能 够 保证 当时 间 趋 向 于 无 穷 时 ， 期 望 交换 遗憾 趋向 于 0。 

© 存在 一 个 从 无 交换 遗憾 算法 设计 到 无 (外 部 ) 遗 憾 算法 的 黑 盒 归 约 。 

e 在 无 交换 遗憾 动力 学 里 ,联合 演化 历史 的 时 间 平 均 会 收敛 到 一 组 相关 均衡 。 

如 果 对 于 任意 一 个 两 人 博弈 的 局 势 ， 一 个 选手 的 收益 是 对 手 的 负数 ， 那 么 就 

称 此 博弈 是 零 和 的 。 

e 最 小 最 大 化 定理 是 指 ， 如 果 一 个 选手 在 两 人 零 和 博弈 里 进行 最 优 行动 ， 那 么 
不 管 此 选手 在 何 时 (对 手 公布 自身 的 策略 之 前 或 者 之 后 ) 公 布 自己 的 混合 策略 ， 
其 所 得 到 的 期 望 收 益 都 是 一 样 的 。 


说 明 


无 交换 遗憾 算法 和 相关 均衡 之 间 的 紧密 联系 出 自 Foster 和 Vohra(1997) 以 及 
Hart 和 Mas-Colell(2000)。 定 理 18.5 出 自 Blum 和 Mansour(2007a)。 有 关 马 尔 可 夫 
链 的 背景 可 以 参见 Karlin 和 Taylor(1975)。 最 小 最 大 化 定理 (定理 18.7) 的 第 一 个 证 
明 出 自 von Neumann(1928)。von Neumann 和 Morgenstern(1944) 受 到 Ville(1938) 
的 启发 给 出 了 一 个 更 简单 的 证 明 。 根 据 von Neumann 的 建议 ( 见 Dantzig (1982))， 
Dantzig(1951)，Gale 等 (1951) 以 及 Adler(2013) 使 得 最 小 最 大 化 定理 与 线性 规划 对 偶 
性 之 间 的 紧密 联系 得 以 阐 清 。 使 用 无 憾 算 法 来 证 明 最 小 最 大 化 定理 的 方法 出 自 Fre- 
und 和 Schapire (1999); 一 个 类 似 的 结果 也 隐 式 包含 在 Hannan (1957) 中 。Cai 等 
(2016) 调 查 了 最 小 最 大 化 定理 在 更 广泛 的 博弈 里 的 扩展 。 问 题 18.2 和 18. 3 分 别 出 自 
Freund 和 Schapire(1999) 以 及 Gilboa 和 Zemel(1989) 。 
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练习 


练习 18. 1 


练习 18. 2 


练习 18. 3 


练习 18. 4 


练习 18.5 


练习 18.6 


问题 


问题 18. 1 


问题 18. 2 


CH) 证明 对 于 任意 大 的 工 ， 一 个 长 度 为 工 的 行动 序列 的 交换 遗憾 可 以 比 
它 的 外 部 遗憾 至 少 多 了 了。 
在 定理 18. 5 中 的 黑 盒 归 约 里 ， 假 设 任意 无 憾 算法 M ，…，M, 都 是 乘 性 
权重 算法 (17. 2 4), 其 中 表示 行动 的 个 数 。 那 么 相应 的 主 算法 里 的 交 
换 遗 憾 是 多 少 ? (BARA n AT ARR) 
用 A 表示 两 人 零 和 博弈 里 行 选手 的 收益 矩阵。 证 明 一 对 混合 策略 ,3 能 
够 形成 一 个 混合 策略 纳什 均衡 当 且 仅 当 他 们 是 一 个 最 小 最 大 化 对 
(minimax pair)， 即 

£ € arg max(min x' Ay) 
A 

jy € arg min(max x Ay) 
CH) GE BA WR Cry sy) A Cee» Yo) HEB A FAL TE EB TER ae NP 
衡 ， 那么 (x, ，y:) 和 (x,，yi) 也 是 此 博弈 的 混合 策略 纳什 均衡 。 
在 两 人 博弈 里 ， 如 果 存 在 常数 a 使 得 两 选手 的 收益 和 在 任意 局 势 下 都 等 
于 &“， 称 此 博弈 为 常 和 (constantsum) 的 。 试 问 最 小 最 大 化 定理 (定理 
18.7) 是 否 在 所 有 常 和 博弈 里 都 成 立 ? 
(H) 如 果 在 任意 局 势 下 三 人 的 收益 和 都 为 0， 则 称 一 个 三 人 博弈 是 零 和 
的 。 试 证 : 任意 一 个 两 人 博弈 都 可 以 作为 特例 包含 于 一 个 三 人 零 和 博 
弈 中 。 


(H) 给 出 一 个 两 人 博弈 ( 非 零 和 )， 其 中 由 无 憾 动力 学 生成 的 一 组 联合 演化 
历史 的 时 间 平 均 不 一 定 收敛 到 一 个 混合 策略 纳什 均衡 。 

固定 一 个 收益 落 在 [一 1，1] 区 间 的 两 人 零 和 博弈 A 以 及 一 个 参数 ee 
(0，1]。 假 设 在 每 一 个 时 间 点 :=1，2，…， TE. 行 选 手 先行 动 并 使 用 
乘 性 权重 算法 选择 一 个 混合 策略 p'， 列 选手 后 行动 并 根据 p 选择 一 个 最 
(ELI g's (REE TSn m/e). JEP m WHE A 的 行 数 。 

(a) 从 行 选手 的 角度 证 明 他 的 时 间 平均 期 望 收益 1S) Cp Ag 至少 为 


min(max x Ay) —e 
y x 
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问题 18. 3 


问题 18. 4 


(b) 从 列 选手 的 角度 证 明 行 选手 的 时 间 平 均 期 望 收 益 最 大 为 

max(min x Ay) 
Ce) 使 用 (a) 和 (b) 给 出 定理 18.7 的 另 一 个 证 明 。 
此 问题 和 下 一 个 问题 都 假设 大 家 对 线性 规划 有 所 了 解 。 这 两 个 问题 说 明 
了 目前 我 们 所 有 计算 简单 的 均衡 概念 都 能 用 线性 规划 来 刻画 。 
考虑 一 个 含 & 个 智能 体 的 代价 最 小 化 博弈 ， 其 中 每 一 个 智能 体 都 有 最 多 
m 个 策略 。 我 们 可 以 把 在 此 博弈 局 势 上 的 一 个 概率 分 布 看 作 空间 上 的 一 
SHER’, 其 中 对 于 任意 局 势 s， 有 z 宇 0 且 2》) =, 一 1。 


SEO 


(a) (H) 给 出 一 个 最 多 有 km 个 关于 z 成 线性 的 不 等 式 的 系统 ， 使 得 此 博 
弈 里 的 粗糙 相关 均衡 可 以 精确 地 表示 为 满足 所 有 不 等 式 的 一 个 解 。 
b) 给 出 一 个 最 多 有 km 个 关于 z 成 线性 的 不 等 式 的 系统 ， 使 得 博弈 里 的 

相关 均衡 可 以 精确 地 表示 为 满足 所 有 不 等 式 的 一 个 解 。 
CH) 证 明 一 个 两 人 堆 和 博弈 里 的 混合 策略 纳什 均衡 可 以 由 一 对 线性 规划 的 
最 优 解 来 刻画 。 
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本 书 最 后 两 节 将 探讨 学 习 动 力学 和 高 效 算法 在 收敛 性 和 均衡 计算 问题 上 的 局 限 
性 ， 并 针对 均衡 计算 问题 提出 NP 完全 问题 的 一 种 类 比 。 本 章 19. 1 节 将 回顾 我 们 之 
前 得 到 的 良好 结论 ，19. 2 节 将 对 计算 复杂 性 理论 进行 引导 ，19. 3 节 将 基于 这 些 基 础 ， 
证 实 拥塞 博弈 中 的 纯 策 略 纳什 均衡 的 计算 是 一 个 困难 的 问题 。 

本 章 及 下 一 章 需 要 读者 具备 多 项 式 时 间 算 法 和 WP 完全 问题 的 基本 知识 。 


19. 1 什么 情况 下 均衡 是 计算 可 行 的 


19.1.1 计算 可 行 性 回顾 


第 16 一 18 章 中 ,我 们 证 明了 四 个 令 人 满意 的 关于 均衡 的 计算 可 行 性 的 结论 ， 通 
过 这 些 结论 我 们 知道 ， 简 单 且 自然 的 动力 系统 能 够 快速 地 收敛 到 一 个 近似 均衡 。 具 体 
可 以 参考 图 19. 1。 这 些 结论 保证 了 这 些 均衡 概念 的 预测 能 力 。 





四 个 计算 可 行 的 结论 

1. (推论 17. 7 和 命题 17.9) 在 任意 一 个 博弈 中 ， 按 照 无 憾 动力 学 进行 联合 交互 的 
时 间 平 均 历 史 很 快 就 收敛 到 一 个 近似 的 粗粮 相关 均衡 (CCE)。 

2. (命题 18. 4 和 定理 18.5) 在 任意 一 个 博弈 中 ， 按 照 无 交换 遗憾 动力 学 进行 联合 
交互 的 时 间 平 均 历 史 很 快 就 收敛 到 一 个 近似 的 相关 均衡 (CE)。 

3,( 推 论 17.7 和 定理 18.7) 在 任意 一 个 两 人 零 和 博弈 中 ， 按 照 无 憾 动力 学 进行 
联合 交互 的 时 间 平 均 历 史 很 快 就 收敛 到 一 个 近似 的 混合 策略 纳什 均衡 
(MNE). 

4. (定理 16.3) 在 任意 一 个 单位 路 由 博弈 中 ， 所 有 智能 体 都 有 相同 的 起 始 节点 和 目 
标 节 点 ， 基 于 e- 最 优 反应 动力 学 的 多 种 变种 很 快 就 收敛 到 一 个 近似 的 纯 策 略 纳 
什 均衡 (PNE) 。 
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在 一 般 化 博弈 中 
计算 可 行 


在 两 人 零 和 博弈 中 
计算 可 行 


计算 可 行 
图 19.1 不 同 级 别 的 均衡 概念 的 计算 可 行 性 。“ 计 算 可 行 ”的 意思 是 简单 且 自然 的 动力 系统 能 
够 快速 收敛 到 一 个 近似 的 均衡 ， 并 且 ， 针 对 精确 的 均衡 计算 存在 多 项 式 时 间 的 算法 
我 们 能 够 证 明 比 上 图 更 强 的 计算 可 行 性 结论 吗 ? 例如 ,在 一 般 化 的 两 人 博弈 中 ， 
简单 的 动力 学 能 快速 收敛 到 一 个 近似 的 混合 策略 纳什 均衡 吗 ? 或者， 在 一 般 化 的 单元 
路 由 博弈 中 ， 简 单 的 动力 学 能 快速 收敛 到 一 个 近似 的 纯 策 略 纳什 均衡 吗 ? 


19. 1.2 动力 学 和 算法 


考虑 到 计算 的 困难 性 ， 我 们 需要 将 我 们 所 立足 的 概念 进行 弱化 。 我 们 之 前 考虑 的 
计算 困难 性 是 指 : 

在 一 类 给 定 的 博弈 中 ， 是 否 存 在 简单 且 自 然 的 动力 学 系统 ， 能 够 快速 地 收敛 到 一 
种 均衡 ? 

现在 我 们 将 其 弱化 ， 重 新 考虑 的 计算 困难 性 是 : 

是 否 存在 一 个 算法 ， 能 够 对 一 类 博弈 快速 计算 出 某 种 均衡 ? 
从 技术 上 来 讲 ,“ 快 速 ”是 指 : 算法 达到 收敛 所 需要 的 循环 次 数 (或 者 计算 机 执行 基本 
操作 所 需要 的 数目 ) 是 不 高 于 一 个 多 项 式 的 ， 这 个 多 项 式 是 构建 所 有 智能 体 代价 或 收 
益 所 需要 的 变量 数目 的 函数 ? 。 例 如 ， 为 了 定义 任意 含有 & 个 智能 体 且 每 个 智能 体 有 
n 个 策略 的 博弈 的 支付 (每 种 博弈 局 势 下 有 上 个 支付 )， 我 们 需要 kn* 个 参数 。 博 弈 的 
特例 往往 具有 更 加 简练 的 形式 ， 参 数 数量 比 kn* DRE. Hin, Ek NE RERA m 条 
边 组 成 的 单元 自私 路 由 博弈 中 ,我 们 只 需要 m 个 参数 就 可 以 用 来 描述 所 有 智能 体 的 
代价 函数 ( 即 每 个 智能 体 TC (1，2，…，A} 的 每 条 边 e 的 代价 函数 是 c.(z) ) 。 

针对 近似 均衡 的 计算 ,一 种 算法 就 是 模拟 动力 学 ， 直 到 它 ( 近 似 ) 收 敛 。 因 为 动力 





O ”严谨 地 讲 ， 我 们 应 该 调查 这 些 代价 或 收益 函数 的 构建 所 需要 的 最 基本 的 比特 操作 的 数目 。 我 们 略 过 
关于 这 个 问题 的 更 深入 讨论 ， 
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学 的 每 一 轮 都 可 以 在 多 项 式 时 间 内 被 模拟 完成 ， 并 且 只 需要 多 项 式 轮 的 迭代 就 可 以 收 
敛 ， 所 以 这 样 的 算法 可 以 在 多 项 式 时 间 内 完成 。19. 1. 1 节 所 涉及 的 四 种 计算 可 行 性 
结论 就 是 这 样 的 情况 ， 这 是 因为 无 憾 和 无 交换 遗憾 动力 学 都 可 以 使 用 计算 高 效 的 子 程 
序 来 实现 。 由 于 上 面 的 第 二 个 目标 比 第 一 个 目标 要 弱 ， 因 此 第 二 个 算法 有 更 多 不 可 实 
现 的 结果 。 

19. 1. 1 节 所 述 的 四 种 情况 中 ， 也 存在 不 基于 自然 动力 学 的 精确 均衡 的 算法 ， 且 
可 在 多 项 式 时 间 内 收敛 (参见 问题 18. 3、18.4 和 19.1)。 但 这 些 精确 的 算法 似乎 并 没 
有 考虑 到 智能 体 的 学 习 。 


19. 1.3 计算 困难 性 的 结论 


在 一 般 化 的 双人 博弈 中 ,并 不 存在 能 快速 收敛 到 近似 混合 策略 纳什 均衡 的 学 习 过 
程 ; 在 一 般 化 的 单元 自私 路 由 博弈 中 ， 并 不 存在 能 快速 收敛 到 近似 纯 俩 略 纳什 均衡 学 
习 过 程 。 不 仅 如 此 ,我们 甚至 都 不 知道 该 如 何 设计 多 项 式 时 间 的 算法 来 计算 这 些 均 
衡 。 那 么 这 些 困 难 到 底 是 因为 什么 呢 ? 是 因为 我 们 目前 的 理论 和 技术 不 成 熟 ? 还 是 由 
于 这 些 问 题 天 然 就 不 可 能 实现 ? 我 们 该 如 何 去 证 明 均 衡 的 计算 究竟 有 多 困难 ? 

以 上 这 些 问题 属于 计算 复杂 性 理论 的 范畴 。 为 什么 我 们 很 容易 设计 出 一 个 多 项 式 
时 间 级 的 最 小 生成 树 算 法 ， 但 是 却 很 难 设计 出 多 项 式 时 间 级 的 旅行 商 算 法 ? 是 不 是 旅 
行商 问题 天 然 就 不 存在 高 效 的 算法 ? 如 果 不 存在 ,我 们 又 如 何 证 明 它 不 存在 ?如 果 我 
们 不 能 证 明 ， 为 什么 我 们 却 又 屡屡 在 实际 问题 中 发 现 该 类 问题 的 计算 是 困难 的 ? 以 上 
这 些 问题 是 使 用 NP 完全 理论 来 进行 处 理 的 。 在 本 章 和 下 一 章 的 内 容 中 ,我 们 假设 读 
者 具备 关于 NA 刀 完全 理论 的 基本 知识 。 我 们 将 针对 均衡 计算 问题 ， 创 造 一 个 类 似 于 
NP 完全 性 的 理论 。 


19.2 局 部 搜索 问题 


在 本 节 中 ， 我 们 暂时 绕 开 均衡 计算 问题 ， 先 来 探讨 一 类 针对 局 部 搜索 问题 进行 
推理 的 复杂 性 理论 。 该 理论 将 会 为 单元 自私 路 由 博弈 中 纯 策 略 纳什 均衡 的 计算 困难 性 
提供 证 据 。 简 单 来 说 ， 这 种 博弈 中 纯 策 略 纳什 均衡 的 计算 等 价 于 公式 (13.7) 定 义 的 势 
函数 的 局 部 最 小 化 的 计算 。 


19.2.1 ZARB: 最 大 割 问题 


学 习 局 部 搜索 的 一 个 经 典 例子 就 是 最 大 割 问题 。 最 大 制 问 题 的 输入 是 一 张 无 向 图 
G 一 (V，E)， 其 中 每 条 边 eEE 的 权重 是 ww.(z, 壹 0) 。 该 问题 的 可 行 解 是 一 个 割 (X， 





日 ”局 部 搜索 问题 可 参考 经 典 的 人 工 智能 教材 。 一 一 译 者 注 


纯 黄 略 纳什 均衡 和 PLS 完全 性 189 





X)， 即 图 的 顶点 集 V 划分 为 两 部 分 。 该 问题 的 目标 是 将 割 边 的 权重 之 和 最 大 化 ， 制 
边 就 是 那些 一 个 顶点 在 集合 X 中 ， 另 一 个 顶点 在 集合 X 中 的 边 ? 。 最 大 割 问题 是 NP 
困难 的 ， 如 果 PNP， 则 该 问题 不 存在 多 项 式 时 间 的 算法 。 

局 部 搜索 是 一 种 很 自然 的 启发 式 算法 ， 它 适用 于 很 多 NP 困难 问题 ,包括 最 大 制 
问题 。 局 部 搜索 的 算法 非常 简单 。 





最 大 割 问 题 的 局 部 搜索 算法 
初始 化 任意 一 个 割 (X，XX) 
while 存在 更 优 的 局 部 移动 do 
进行 任意 一 个 这 样 的 局 部 移动 











这 里 局 部 移动 的 意思 是 ,将 一 个 点 v 从 割 的 一 侧 移动 到 另 一 侧 。 例 如 ， 如 果 将 节点 v 
从 集合 X 移动 到 XX ， 则 目标 函数 的 增 量 为 





t= 2, Üa (19. 1) 
uEX:(uw) EE wE Ru EE 
新 产生 的 制 边 新 产生 的 非 割 边 


如 果 以 上 公式 中 的 差 是 正 数 ， 那 么 这 样 的 一 个 局 部 移动 就 是 更 优 的 。 如 果 找 不 到 更 优 
的 局 部 移动 ， 局 部 搜索 算法 就 结束 了 ， 结 束 时 产生 的 结果 就 是 局 部 最 优 。 局 部 最 优 不 
一 定 是 全 局 最 优 (参见 图 19. 2) 。 





x V\X 


图 19.2 FERPA AK RGAE, eB A eT ee fe. CX, VX) A H R RAE A 
15,， 且 任意 一 个 局 部 移动 都 会 导致 目标 函数 值 的 降低 。 而 全 局 最 优 值 为 17 


我 们 可 以 将 局 部 搜索 算法 可 视 化 ， 展 示 为 图 19.3 中 的 有 向 图 互 上 的 一 个 行走 。 
对 于 最 大 割 问 题 ， 它 的 输入 是 一 个 图 G， 那 么 相对 应 的 ， 在 可 视 化 的 有 向 图 H 中 ， 





O 图 的 割 往 往 要 求 两 侧 的 点 集 都 非 空 这 一 额外 限制 条 件 。 但 是 空 割 并 不 会 改变 最 大 割 问题 ， 
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每 条 有 向 边 表示 一 个 更 优 的 局 部 移动 。 这 些 局 部 移动 间 不 应 该 有 环 ， 所 以 图 H 是 一 
个 有 向 无 环 图 。 图 互 中 没有 出 边 的 节点 (吸收 点 ) 表 示 局 部 最 优 。 局 部 搜索 算法 在 图 
H 中 不 断 地 沿 着 出 边 进行 行走 ， 直 到 进入 一 个 吸收 点 为 止 。 


O 


图 19.3 局 部 搜索 可 以 被 描绘 成 在 一 个 有 问 无 环 图 上 的 行走 。 有 向 无 环 图 上 的 节点 代表 可 
行 解 ， 边 代表 更 优 的 局 部 移动 ， 吸 收 点 代表 局 部 最 优 

由 于 局 部 最 优 只 会 多 于 全 局 最 优 ， 所 以 局 部 最 优 更 容易 被 寻找 到 。 例 如 ,考虑 在 所 
有 边 权 均 为 1 的 图 上 进行 最 大 割 的 问题 。 这 时 计算 一 个 全 局 的 最 大 制 仍然 是 一 个 NP 难 
问题 ， re 因为 在 这 种 设 定 下 ， 目 标 函 数 的 值 只 能 取 自 集 
合 {0，1，2，…，| 巨 |}， 所 以 循环 最 多 只 需要 进行 | 无 | 次 就 可 以 找到 局 部 最 优 。 

但 是 ， A te E 目前 并 没有 基于 
局 部 搜索 的 多 项 式 时 间 算 法 。 我 们 是 如 何 知道 这 一 点 的 呢 ? 针对 以 上 论断 ， 一 个 最 强 
的 证 明 应 该 是 “无 条 件 的 ”>， 即 在 不 依靠 任何 未 被 证 明 的 前 提 或 假设 的 情况 下 ， 直 接 
ee ee 但 是 目前 尚 无 人 知晓 如 何 完成 这 样 “ 无 条 
件 的 ”证 明 。 实 际 上 ， 这 样 的 一 个 “无 条 件 的 ”证 明 能 将 PEM NP 划分 开 来 。 
GRIM, RIG PUNE Ae RSNI. SPRL oN, 
才 存 在 多 项 式 时 间 的 算法 。 在 第 20 章 中 ,我 们 将 会 解释 为 什么 这 仍然 是 一 个 过 高 的 
目标 。 我 们 将 为 局 部 搜索 问题 创造 一 种 类 似 于 NP 完全 性 的 分 析 方 法 。 作 为 副产品 ， 
我 们 还 会 得 到 在 局 部 搜索 问题 中 ， 在 最 坏 情况 下 实现 局 部 最 优 时 所 需要 的 迭代 次 数 的 
无 条 件 下 界 。 


19.2.2 PLS: 抽象 局 部 搜索 问题 


本 节 和 下 一 节 将 证 明 : 最 大 割 问题 中 局 部 最 优 的 计算 和 任何 其 他 局 部 搜索 问题 
同样 困难 。 这 个 论断 涉及 NP 完全 性 的 核心 思想 。NP 完 全 性 表示 的 是 一 个 问题 和 
所 有 多 项 式 时 间 可 验证 的 问题 具有 相同 的 计算 困难 度 。 对 于 那些 “最 困难 的 ”局 部 
搜索 问题 ， 我 们 并 不 期 待 能 有 算法 比 局 部 搜索 算法 有 显著 提升 。 这 个 思想 是 和 NP 
完全 问题 相对 应 的 。 考 虑 到 AMP 完全 问题 ， 我 们 不 期 待 能 有 比 蛮 力 搜索 好 很 多 的 算 
法 存在 。 
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上 面 提 到 的 “任何 其 他 局 部 搜索 问题 ”是 什么 意思 ? 作为 类 比 ， 回 想 NP 问题 指 
的 是 ， 对 某 个 特定 问题 给 定 一 个 验证 器 ， 它 能 够 在 多 项 式 时 间 内 完成 对 某 个 解 的 验 
证 。 例如， 一 个 逻辑 公式 中 的 每 个 变量 该 如 何 赋 真 值 ， 或 者 一 个 图 中 的 汉密尔顿 圈 问 
题 。 从 某 种 意义 上 讲 ， 一 个 高 效 的 验证 器 ， 实 际 上 就 是 在 所 有 可 能 的 解 中 执行 蛮 力 搜 
索 所 必需 的 最 基本 组 件 ， 而 NP 就 是 能 够 使 用 蛮 力 搜索 来 完成 的 问题 的 集合 。 类 似 
地 ， 对 于 局 部 搜索 ， 所 需要 的 最 基本 组 件 是 哪些 呢 ? 

一 个 抽象 局 部 搜索 问题 可 以 是 一 个 最 大 化 问题 或 者 最 小 化 问题 。 抽 象 局 部 搜索 问 
题 应 该 能 用 以 下 三 个 多 项 式 时 间 的 算法 来 实现 。 








抽象 局 部 搜索 问题 的 基本 组 件 

1. 第 一 个 多 项 式 时 间 的 算法 : 输入 是 一 个 局 部 搜索 问题 的 情境 ， 输 出 是 任意 一 个 
可 行 解 。 

2. 第 二 个 多 项 式 时 间 的 算法 : 输入 是 一 个 局 部 搜索 问题 的 情境 和 它 的 一 个 可 行 
解 ， 输 出 是 这 个 解 的 目标 函数 值 。 

3. 第 三 个 多 项 式 时 间 的 算法 : 输入 是 一 个 局 部 搜索 问题 的 情境 和 它 的 一 个 可 行 
解 ， 这 个 算法 要 么 报告 当前 的 解 就 是 局 部 最 优 解 ， 要 么 产生 一 个 具有 更 好 目标 
函数 值 的 解 。 











例如 ， 在 最 大 割 问题 中 ， 第 一 个 算法 会 输出 任意 一 个 最 大 制 。 第 二 个 算法 会 计算 
所 有 制 边 的 权重 之 和 。 第 三 个 算法 会 检查 所 有 的 |V | 个 局 部 移动 。 如 果 所 有 这 些 局 部 
移动 都 不 是 更 优 的 ， 那 么 该 算法 将 输出 “已 局 部 最 优 ”; 否则 ， 该 算法 将 选择 一 个 更 
优 的 局 部 移动 并 输出 新 的 制 结果 。 

每 一 个 抽象 局 部 搜索 问题 的 程序 都 具备 上 述 三 个 组 件 。 在 一 个 具体 的 实例 情境 
下 , 一 个 通用 的 局 部 搜索 程序 使 用 第 一 个 算法 来 得 到 一 个 初始 解 ， 然 后 迭代 地 运行 第 
三 个 算法 ， 直 到 局 部 最 优 解 出 现 >。 可 行 解 的 目标 函数 值 是 严格 地 不 断 改 善 的 ， 直 至 
最 优 解 被 找到 ; 且 可 行 解 的 数量 是 有 限 的 ， 所 以 这 三 个 组 件 组 成 的 程序 最 终 会 停止 。 
例如 ， 对 于 最 大 制 问题 ， 以 上 局 部 搜索 程序 可 以 视 为 在 一 张 有 向 无 环 图 上 的 行走 





日 ”我 们 忽略 掉 一 些 具体 细节 。 例如， 所 有 的 算法 都 应 该 检查 给 定 的 输入 是 否 对 一 个 情境 进行 了 合法 的 
编码 。 当 一 个 算法 的 表现 有 错误 时 ， 有 一 些 简便 的 检测 方法 ， 比 如 运行 时 间 过 长 或 者 输出 了 一 些 无 
效 结果 。 例 如 ， 我 们 可 以 将 第 三 个 算法 的 输出 表示 为 “局 部 最 优 ”， 除 非 它 返回 了 一 个 比 之 前 更 好 的 
可 行 解 并 且 被 第 二 个 算法 在 多 项 式 阶 的 步骤 内 验证 。 这 些 细节 保证 了 使 用 以 上 这 三 个 算法 作为 “ 黑 
盒 ” 的 一 般 化 局 部 搜索 程序 总 能 在 局 部 最 优 处 停 下 来 。 

O ”第 二 个 算法 的 目的 是 确保 第 三 个 算法 的 输出 是 可 靠 的 ， 并 且 保证 第 三 个 算法 产生 的 每 一 个 新 的 解 都 
好 于 原来 的 解 。 如 果 第 三 个 算法 没 能 算出 一 个 更 好 的 解 ， 则 将 当前 解 诠释 为 一 个 “局 部 最 优 ”。 

O 这 三 种 算法 都 是 在 多 项 式 时 间 内 运行 的 ， 这 隐 含 着 要 求 可 行 解 具有 多 项 式 阶 的 描述 长 度 。 所 以 ， 最 
多 只 会 有 指数 级 个 可 行 解 。 
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(图 19. 3) 。 第 一 个 算法 找到 起 始 节点 ， 第 于 个 算法 沿 着 一 系列 的 出 边 来 行走 。 因 为 
可 行 解 的 数目 可 以 是 输入 大 小 的 指数 级 的 ， 这 样 的 局 部 搜索 算法 可 能 会 需要 比 多 项 式 
更 高 的 迭代 次 数 。 

抽象 局 部 搜索 问题 的 目标 是 计算 一 个 局 部 最 优 ， 它 的 等 价目 标 是 在 其 所 对 应 的 有 向 
无 环 图 上 找到 一 个 吸收 点 。 这 个 目标 可 以 通过 运行 通用 局 部 搜索 算法 来 完成 ， 但 是 任何 
其 他 可 以 计算 局 部 最 优 的 正确 算法 也 都 可 以 使 用 。PLS 是 指 所 有 这 些 抽象 局 部 搜索 问 
题 的 集合 ” 。 你 所 见 过 的 大 多 数 甚 至 全 部 的 局 部 搜索 问题 都 可 以 被 归 为 PLS 问题 。 


19.2.3 PLS 完全 性 


我 们 的 目标 是 要 证 明 ， 对 一 个 最 大 割 问题 计算 局 部 最 优 是 和 所 有 其 他 的 局 部 搜索 
问题 同样 困难 的 。 上 一 节 中 ， 我 们 重点 探讨 了 何 为 “所 有 其 他 局 部 搜索 问题 ”。 现 在 
开始 ,我们 开始 规范 化 地 阐述 “同样 困难 ”这 一 词 为 何 意 。 我 们 将 使 用 NP 完全 性 理 
论 中 的 多 项 式 时 间 归 约 来 实现 这 一 规范 化 阐述 。 

从 一 个 问题 Li C PLS 到 问题 LE PLS 的 归 约 由 两 个 多 项 式 时 间 的 算法 组 成 。 这 
两 个 算法 有 如 下 所 示 的 性 质 。 








PLSI 
1. 算法 Ai 将 Li 问题 的 每 一 个 实例 情境 工 EL kia L 问题 中 的 一 个 实例 情境 
Ailt) E Lze 
2. 算法 As 将 实例 情境 A (Cz) 的 每 一 个 局 部 最 优 映射 到 实例 情境 工 的 局 部 最 优 。 











归 约 的 定义 保证 了 如 果 我 们 能 够 在 多 项 式 时 间 内 给 出 Lo 类 问题 的 解 ， 根据 算 法 
A 和 .4， 我 们 也 能 够 在 多 项 式 时 间 内 给 出 Li 问题 的 解 (图 19. 4) 。 


五 的 算法 


Ay os) ~、 | A: 0) 的 解 
> 


图 19.4 KL, F| L 的 归 约 。 这 个 归 约 通过 解决 一 个 PLS 问题 L 来 实现 解决 一 个 PLS 问题 上 









x 的 解 


定义 19. (PLS 完全 问题 ) 如 果 一 个 问题 LEPLS 且 所 有 在 PLS 集合 中 的 问题 
都 能 归 约 到 工 ， 则 称 工 是 一 个 PLS 完全 问题 。 
通过 定义 19.1 可 知 ，PLS 完全 问题 存在 多 项 式 时 间 的 算法 ， 当 且 仅 当 所 有 的 


© PLS 是 “polynomial local search” 的 缩写 ， 即 多 项 式 级 的 局 部 搜索 。 译 者 注 
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PLS 问题 都 能 在 多 项 式 时 间 内 被 解决 。° 

PLS 完全 问题 是 一 个 同时 对 所 有 的 局 部 搜索 问题 进行 表示 的 问题 。 如 果 我 们 没 
有 关于 AP 完全 性 的 卓越 理论 ， 我们 可 能 不 会 相信 PLS 完全 问题 的 存在 。 但 是 就 像 
NP 完全 问题 一 样 ，PLS 完全 问题 是 存在 的 。 不 仅 如 此 ,许多 自然 而 且 和 实际 息 息 相 
KA, AMAR BM. MWe PLS 完全 问题 。 

EH 19.2(RAB OMe PLS 完全 的 ) 对 于 一 般 化 的 、 边 权 非 负 的 最 大 割 问 
题 ， 计 算 局 部 最 优 是 一 个 PLS 完全 问题 。 

这 个 定理 的 证 明 比 较 困 难 ， 已 经 超出 了 本 书 的 范畴 ( 见 说 明 部 分 ) 。 

我 们 已 经 提 到 过 一 个 有 条 件 的 结论 就 是 ， 除 非 所 有 的 PLS 问题 都 可 以 在 多 项 式 
时 间 内 被 解决 ，PCS 完全 问题 就 不 存在 多 项 式 时 间 的 算法 ， 不管 是 基于 局 部 搜索 还 
是 其 他 方法 。 不 论 是 不 是 所 有 的 PLS 都 能 在 多 项 式 时 间 内 被 解决 ， 定 理 19. 2 的 证 明 
都 意味 着 ， 在 最 坏 情 况 下 ， 有 具体 的 局 部 搜索 算法 的 时 间 复 杂 度 是 指数 级 的 。 

定理 19. 3( 局 部 搜索 的 下 界 ) ”对 于 一 般 化 的 、 边 权 非 负 的 最 大 割 问 题 ， 如 果 使 
用 局 部 搜索 来 实现 局 部 最 优 ， 无 论 在 每 一 次 选 代 中 如 何 做 出 局 部 移动 ， 所 需 的 选 代 次 
数 都 可 以 是 (节点 数目 |V | 的 ) 指 数 级 的 。 


19.3 计算 拥塞 博弈 的 纯 策略 纳什 均衡 


19.3.1 计算 纯 策 略 纳什 均衡 是 PLS 问题 


在 13. 2. 3 节 中 ,我 们 介绍 了 拥塞 博弈 , 它 是 单元 自私 路 由 博弈 的 一 种 很 自然 的 
泛 化 。 在 拥塞 博弈 中 ， 策 略 是 所 有 边 集 的 一 个 子 集 ， 而 不 再 必须 是 一 条 路 径 。 那 么 一 
个 拥塞 博弈 可 以 描述 为 以 下 形式 : 一 个 资源 集合 E( 即 单元 自私 路 由 博弈 中 的 边 )， 对 
于 任意 一 个 智能 体 i 王 1，2，…,， k， 都 有 一 个 清晰 描述 的 策略 集合 Si 三 25( 即 单位 自 
私 路 由 博弈 中 的 0 一 d, 路 径 )， 以 及 每 一 个 资源 eEE 的 可 能 代价 c.(1)，…，c.(k)。 
在 一 个 博弈 局 势 s 下 ， 智 能 体 i 的 总 代价 CCs) 仍 然 是 他 所 使 用 的 所 有 资源 的 代价 之 和 ， 
即 D>)e,(n,(s)) ， 其 中 n(s) 表 示 的 是 在 局 势 s 下 使 用 资源 。 的 智能 体 的 数目 。 

关于 单元 自私 路 由 博弈 的 结论 (定理 12.3、13.6 和 16. 3) 推 广 到 拥塞 博弈 中 仍然 


成 立 ， 而 且 证 明 方 式 仍然 相同 。 每 一 个 拥塞 博弈 都 是 一 个 势 博弈 (参见 13. 3 节 )， 其 
势 函数 是 


n (5) 
B= > a (19. 2) 


EE isl 





O 大 多 数 研 究 者 相信 PLS 完全 问题 不 能 在 多 项 式 时 间 内 被 解决 ， 虽然 这 并 不 像 对 P 才 NP 有 那么 强 的 
信心 。 
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以 上 势 函 数 对 于 每 一 个 博弈 局 势 s， 每 一 个 智能 体 i， 以 及 i 的 单方 面 转换 到 的 新 策略 
sio WWE 
(5s) ss) — OCs) = C(s; ss) —C,(s) (19. 3) 
我 们 断言 ， 对 于 一 个 拥塞 博弈 计算 纯 策 略 纳什 均衡 是 一 个 PLS 问题 。 这 是 因为 
拥塞 博弈 问题 中 的 最 优 反应 动力 学 (参见 16. 1 节 ) 与 局 部 搜索 问题 的 势 函数 是 一 致 的 。 
要 证 明 这 个 断言 的 话 ， 我 们 需要 描述 PLS 问题 定义 中 的 三 个 多 项 式 时 间 的 算法 。 第 
一 个 算法 的 输入 是 一 个 拥塞 博弈 ， 包 括 智 能 体 的 策略 集合 以 及 资源 代价 函数 ， 输 出 是 
任意 一 个 博弈 局 势 。 第 二 个 算法 的 输入 是 拥塞 博弈 和 一 个 局 势 *， 输出 是 一 个 势 函 数 
(19.2) 的 值 。 第 三 个 算法 检查 给 定 的 局 势 是 否 是 纯 策略 纳什 均衡 ， 这 样 的 检查 是 通过 
分 析 每 个 智能 体 单方 面 偏 离 均衡 是 否 会 导致 损失 来 实现 的 5 。 如 果 这 个 局 势 是 纯 策 略 
纳什 均衡 ， 那 么 第 三 个 算法 将 会 报告 达到 了 “局 部 最 优 ”; 否则 ， 执 行 新 的 一 次 最 优 
反应 动力 学 ， 并 返回 新 的 博弈 局 势 。 根 据 公 式 (19. 3) 可 知 ， 这 个 新 的 博弈 局 势 会 有 更 
小 的 势 函 数值 。 


19.3.2 纯 策 略 纳什 均衡 的 计算 是 PLS 完全 问题 


计算 拥塞 博弈 中 的 纯 策 略 纳 什 均衡 是 和 任何 其 他 局 部 搜索 问题 同样 困难 的 。s 

定理 19. 4( 纯 策略 纳什 均衡 的 计算 是 PLS 完全 问题 ) 对 拥塞 博弈 计算 纯 策略 纳 
什 均衡 是 一 个 PLS 完全 问题 。 

证 明 : 因为 归 约 是 可 传递 的 ， 我们 只 需要 实现 从 某 一 个 PLS 完全 问题 到 拥塞 博 
弈 中 纯 策略 纳什 均衡 计算 问题 的 归 约 即 可 。 我 们 已 经 知道 最 大 割 问 题 中 计算 局 部 最 优 
是 一 个 PLS 完全 问题 (定理 19. 2) ， 现 在 我 们 给 出 一 个 从 它 到 拥塞 博弈 中 计算 纯 策 略 
纳什 均衡 的 归 约 。 

归 约 过 程 中 的 第 一 个 多 项 式 时 间 算 法 A, 的 输入 是 一 个 图 G 二 (V，E)， 图 的 边 权 
{w, juee 非 负 。 这 个 算法 将 构建 如 下 的 拥塞 博弈 。 

1. 智能 体 对 应 图 上 的 点 V。 

2. 图 上 的 每 条 边 eEE 有 两 个 资源 ，r, Alr.. 

3. 智能 体 v 有 两 个 策略 ， 每 一 个 都 由 |6(v) | 个 资源 组 成 ， 其 中 ow EEA G 中 
连接 到 节点 v 的 边 的 集合 ， 并 且 有 {7,}) co FUT bea o 

4. 边 e 二 (wu，v) 上 的 资源 x, Mr, 只 能 被 智能 体 w 或 v 使 用 。 如 果 只 有 一 个 智能 体 
使 用 ， 则 该 资源 的 代价 为 0， 如 果 两 个 智能 体 都 使 用 ， 则 该 资源 的 代价 为 w 

以 上 算法 的 构建 可 以 在 多 项 式 时 间 内 完成 。 


O ”在 这 样 的 博弈 中 ， 每 个 智能 体 的 策略 集 都 在 输入 中 清晰 给 出 了 ， 所 以 这 个 算法 是 多 项 式 时 间 内 能 完 
成 的 。 

O 计算 所 有 纳什 均衡 或 者 计算 一 个 有 上 额外 约束 条 件 的 纳什 均衡 只 会 使 问题 变 得 更 难 ( 参 见 练习 19. 3)。 
计算 某 一 个 任意 的 纯 策略 纳什 均衡 更 简单 可 行 一 些 。 
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关键 在 于 ， 给 定 的 最 大 割 问题 中 的 局 部 最 优 与 上 面 构建 出 的 这 个 拥塞 博弈 的 纯 策 
略 纳什 均 衔 是 一 一 对 应 关系 。 拥 塞 博弈 中 的 21"1 种 局 势 与 图 G 上 的 割 是 双 射 的 。 一 
个 博弈 局 势 就 对 应 了 一 个 制 (X，X)， 博弈 中 的 每 一 个 智能 体 都 对 应 于 图 中 的 一 个 节 
点 vEX( 或 者 vEX)， 每 一 个 智能 体 所 选择 的 策略 基 将 连接 到 它 的 边 上 的 资源 列 为 
(或 者 7.)。 

这 样 的 双 射 将 总 割 边 权 重 之 和 为 wX, DKA, DRAR A, E 
博弈 局 势 的 势 函 数值 等 于 WW 一 ww(X，X), 其 中 W = 24%. ， 即 图 中 所 有 边 权 之 和 。 


固定 一 个 割 (X，X) ， 对 于 被 它 割 断 的 边 ec， 其 上 的 两 个 资源 ~ 和 元 中 每 一 个 都 只 被 
一 个 智能 体 使 用 ， 所 以 它 对 公式 (19. 2) 的 贡献 为 0。 对 于 没有 被 这 个 割 割 断 的 边 e， 六 
和 元 其 中 一 个 被 两 个 智能 体 使 用 ， 另 一 个 没有 智能 体 使 用 。 在 这 种 情况 下 ， 一 部 分 对 
公式 (19. 2) 的 贡献 为 ww,， 男 一 部 分 的 贡献 为 0。 可 知 博弈 局 势 的 势 函 数 的 值 就 等 于 图 
中 没有 被 割断 的 那些 边 的 权重 之 和 ， 即 W 一 w(X，X)。 

具有 更 高 权重 的 制 就 对 应 着 更 低 的 势 函数 值 ， 所 以 图 G 上 局 部 最 优 的 割 与 最 小 
化 的 势 函 数 是 一 一 对 应 的 。 根 据 公 式 (19. 3)， 势 函数 的 局 部 最 小 化 又 与 拥塞 博弈 中 的 
纯 策略 纳什 均衡 是 一 一 对 应 的 。 

归 约 过 程 的 第 二 个 算法 A 只 需要 将 由 算法 A 找到 的 拥塞 博弈 的 一 个 纯 策略 纳 
什 均衡 进行 转换 ， 翻 译 成 图 G 上 的 一 个 最 大 割 问题 的 局 部 最 优 解 即 可 。 n 

定理 19. 4 的 证 明 中 的 归 约 为 最 大 割 问 题 中 优化 的 局 部 移动 和 拥塞 博弈 中 有 利 的 
偏离 策略 建立 起 了 一 一 对 应 的 关系 。 所 以 ， 最 大 割 问 题 中 局 部 搜索 所 需要 的 迭代 次 数 
的 无 条 件 下 界 就 能 够 被 移植 到 拥塞 博弈 中 ， 构成 最 优 反应 动力 学 收敛 所 需要 的 和 迭代 次 
数 的 无 条 件 下 界 。 

推论 19. 5( 最 优 反应 动力 学 的 下 界 ) 对 于 & 个 智能 体 的 拥塞 博弈 ， 无 论 在 每 次 
迭代 中 如 何 选择 智能 体 的 偏离 策略 ,使 用 最 优 反 应 动力 学 计算 纯 策 略 纳什 均衡 都 会 需 
要 上 的 指数 级 的 迭代 次 数 。 

一 般 来 说 ， 使 用 归 约 来 证 明 推论 19. 5 中 的 下 界 会 更 加 方便 一 些 。 


19.3.3 对称 拥塞 博弈 


在 本 章 的 最 后 一 部 分 ， 我 们 给 出 另外 一 个 归 约 ， 它 可 以 帮助 我 们 将 定理 19. 4 和 
推论 19. 5 扩展 到 对 称 拥塞 博弈 中 。 在 对 称 拥塞 博弈 中 ,每 一 个 智能 体 的 策略 空间 是 
相同 的 ， 且 每 一 个 智能 体 的 初始 节点 和 目标 节点 是 相同 的 ， 它 是 单位 自私 路 由 博弈 的 
一 种 泛 化 。S 





日 ”对 称 单元 自私 路 由 博弈 的 纯 策略 纳什 均衡 可 以 在 多 项 式 时 间 内 求解 ( 见 问题 19. 1)， 所 以 ， 它 很 可 能 
不 是 PLS 完全 问题 。 





定理 19. 6( 对 称 博弈 的 PCS 完全 性 ) ”对 称 拥 塞 博 弈 中 的 纯 策 略 纳什 均衡 计算 是 
PLS 完全 问题 。 

证 明 : 根据 定理 19.4， 计 算 一 般 化 的 拥塞 博弈 中 的 纯 策 略 纳 什 均衡 是 一 个 PLS 完 
全 问题 。 我 们 将 这 样 的 问题 归 约 到 在 对 称 拥 塞 博弈 中 计算 纯 策 略 纳什 均衡 的 问题 。 给 定 
一 个 一 般 化 的 拥塞 博弈 ， 其 中 有 已 个 资源 和 个 智能 体 ， 智 能 体 的 策略 集 是 S ，…， 
St， 归 约 过 程 的 第 一 个 多 项 式 时 间 算 法 .4 会 构建 一 个 “对 称 ” 的 博弈 版 本 。 在 这 个 对 
称 的 博弈 中 ， 智 能 体 不 变 ， 新 的 资源 集合 是 EU {rn ，…， ni)。 原 始 集 合 巨 中 的 边 所 关 
联 到 的 资源 的 代价 函数 不 变 。 如 果 一 个 新 加 入 的 资源 x; 只 被 一 个 智能 体 使 用 ， 则 它 
的 代价 函数 是 0; 如 果 它 被 多 个 智能 体 使 用 ， 则 它 的 代价 函数 是 无 穷 大 。 每 一 个 智能 
体 i 的 策略 集合 新 加 上 了 资源 x;， 并 且 每 一 个 智能 体 都 可 以 使 用 这 个 扩张 了 的 策略 集 
合 中 的 任意 策略 。 也 就 是 说 ， 所 有 智能 体 有 一 个 公共 的 策略 集 {s;U {ri}: Eil, 2, 
sy khs SES). FRE GETS EA A r: 的 策略 可 以 视 为 在 原始 博弈 中 选择 智能 体 i 
这 一 身份 。 关 键 在 于 ， 在 这 个 新 构建 的 对 称 拥塞 博弈 中 ,在 纯 策 略 纳什 均衡 下 ， 每 个 
智能 体 选 择 的 都 是 原始 博弈 中 单独 一 个 智能 体 的 身份 。 这 是 因为 如 果 智 能 体 共 享 新 引 
入 的 那些 资源 的 话 ， 代 价 将 是 巨大 的 。 算 法 .4 可 以 很 容易 地 将 这 样 一 个 纯 策 略 纳什 
均衡 映射 到 原始 的 拥塞 博弈 中 的 纯 策 略 纳什 均衡 ， 从 而 完成 归 约 。 e 

类 似 推论 19.5. E 19. 6 的 证 明 能 告诉 我 们 最 优 反 应 动力 学 收敛 所 需要 的 迭代 
次 数 的 无 条 件 下 界 ( 见 练习 19.4). 

推论 19. 7( 最 优 反应 动力 学 的 下 界 ) ”对 于 上 个 智能 体 的 对 称 拥塞 博弈 ， 无论 在 
每 一 次 迭代 中 如 何 选择 智能 体 的 偏离 策略 ， 使 用 最 优 反应 动力 学 计算 纯 策略 纳什 均衡 
都 会 需要 有 & 的 指数 级 的 迭代 次 数 。 

定理 16. 3 告诉 我 们 ， 在 对 称 拥塞 博弈 中 ，e- 最 优 反应 动力 学 可 以 快速 收 僵 。 为 
什么 这 个 结论 不 与 定理 19. 6 和 推论 19. 7 相互 冲突 呢 ? 这 是 因为 se- 最 优 反应 动力 学 只 
会 收敛 到 一 个 近似 的 纯 策略 纳什 均衡 ， 而 定理 19. 6 讨论 的 是 纯 策 略 纳什 均衡 是 计算 
困难 的 ?> 。 因 此 ， 定 理 19. 6 和 推论 19. 7 给 出 了 精确 纯 策 略 纳什 均衡 和 近似 纯 策略 纳 
什 均衡 在 计算 可 行 性 上 的 区 别 ， 也 给 出 了 对 称 拥塞 博弈 中 的 最 优 反应 动力 学 和 e- 最 优 
反应 动力 学 在 收敛 性 上 的 区 别 。 


总 结 


© 在 任意 博弈 中 ， 自 然 且 简 单 的 动力 学 能 快速 收敛 到 近似 粗糙 相关 均衡 (CCE) 和 
近似 相关 均衡 (CE); 在 两 人 零 和 博弈 中 ,它们 能 快速 收敛 到 近似 混合 策略 纳 





OQ ”我 们 对 于 定理 19. 6 的 证 明 同 样 违 背 了 定理 16. 3 中 的 假设 。 但 是 这 个 证 明 可 以 进行 修改 ,使 其 适用 于 
定理 16. 3 中 的 假设 条 件 。 
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什 均衡 ; 在 对 称 拥 塞 博弈 中 ， 它 们 能 快速 收敛 到 近似 纯 策 略 纳什 均衡 (PNE) 。 

为 (近似 ) 均 衡 的 计算 设计 一 个 快速 的 算法 要 比 证 明 简 单 的 动力 学 能 快速 收敛 

这 一 目标 要 弱 。 

PLS 是 抽象 局 部 搜索 问题 的 集合 ， 它 包括 了 计算 局 部 最 大 割 问题 以 及 计算 拥 

塞 博弈 中 的 纯 策 略 纳什 均衡 的 问题 。 

如 果 所 有 在 PLS 集合 中 的 问题 都 能 归 约 到 某 一 个 问题 ， 则 称 这 个 问题 是 一 个 

PLS 完全 问题 。 

对 PLS 完全 问题 存在 多 项 式 时 间 的 算法 ， 当 且 仅 当 每 一 个 PLS 问题 都 可 以 在 

多 项 式 时 间 内 被 解决 。 大 多 数 研究 者 认为 PCS 完全 问题 不 能 在 多 项 式 时 间 内 

被 解决 。 

对 拥塞 博弈 计算 纯 策 略 纳什 均衡 是 一 个 PLS 完全 问题 ， 即 使 是 对 于 它 的 特殊 

情况 对 称 拥塞 博弈 也 是 这 样 的 。 

© 在 拥塞 博弈 中 ， 最 优 反应 动力 学 收敛 到 一 个 纯 策 略 纳什 均衡 会 需要 指数 式 级 
的 迭代 次 数 ， 即 使 是 对 于 它 的 特殊 情况 对 称 拥塞 博弈 也 是 这 样 的 。 


说 明 


Garey 和 Johnson(1979) 这 篇 论文 是 对 于 NP 完全 性 理论 很 好 的 入 门 材料 ; 还 可 
以 参考 Roughgarden(2010b) 中 与 算法 博弈 论 相 关 的 例子 。PLS 复杂 度 集合 的 定义 参 
HE Johnson 等 (1988)， 此 文中 提供 了 PLS 完全 问题 的 示例 ， 并 证 明了 在 这 些 问题 中 ， 
使 用 局 部 搜索 来 计算 局 部 最 优 时 ， 最 坏 情 况 下 所 需要 的 迭代 次 数 的 无 条 件 下 界 。 
Schaffer 和 Yannakakis(1991) 证 明了 定理 19.2 和 19.3。19. 3 节 的 所 有 结论 以 及 问题 
19. la 都 来 自 于 Fabrikant 等 (2004)。 问 题 19. 1b 来 自 于 Fotakis(2010), Fabrikant 
等 (2004) 还 证 实 了 在 单元 自私 路 由 博弈 中 计算 纯 策 略 纳什 均衡 是 一 个 PLS 完全 问题 。 
Skopalik 和 V6cking(2008) 证 实 了 在 一 般 化 的 单元 自私 路 由 博弈 中 ， 定 理 19.4 和 推 
论 19. 5 对 于 计算 e- 纯 策略 纳什 均衡 和 e- 最 优 反 应 动力 学 仍然 成 立 。Papadimitriou 和 
Roughgarden(2008) 解 决 了 在 多 项 式 时 间 内 精确 和 近似 计算 相关 均衡 的 问题 ( 见 练习 
19.1, 19.2). Jiang 和 Leyton-Brown(2015) 探 讨 了 简洁 型 博弈 ， 例 如 拥塞 博弈 的 相 
关 均 衡 的 解法 。Hart 和 Nisan(2013) 探 讨 了 一 般 化 博弈 的 近似 和 精确 相关 均衡 的 
解法 。 


练习 


练习 19. 1 假设 针对 一 个 线性 规划 问题 ， 如 果 其 最 优 解 存 在 ， 则 可 以 在 该 问题 描述 
参数 规模 的 多 项 式 时 间 内 计算 出 来 。 基 于 这 个 假设 和 问题 18. 3， 给 出 一 
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练习 19. 2 


练习 19. 3 


练习 19. 4 
练习 19.5 


问题 


问题 19. 1 


个 通用 代价 最 小 化 博弈 中 相关 均衡 的 算法 。 你 的 算法 应 该 在 该 博弈 描述 
参数 规模 的 多 项 式 时 间 内 运行 完 。 

(H) 练 习 19. 1 是 否 意味 着 ， 对 于 拥塞 博弈 计算 相关 均衡 ， 可 以 在 该 博弈 
描述 的 多 项 式 时 间 内 完成 ? 

(了 HH) 证 明 以 下 问题 是 NP 完全 问题 : 给 定 一 个 通用 拥塞 博弈 和 一 个 实数 值 
目标 *， 判 定 该 博弈 是 否 存在 一 个 代价 最 多 是 r 的 纯 策略 纳什 均衡 。 
解释 为 什么 定理 19. 6 中 的 归 约 能 推出 推论 19. 7。 

给 定 一 个 通用 单元 自私 路 由 博弈 ， 其 中 初始 节点 为 ou，…，ou， 目 标 节 
点 为 di1，…，d:， 现 在 增加 新 的 初始 节点 o 和 目标 节点 d 以 及 新 的 有 向 
Wo, 01)，…，(0，01) 和 (di ，d)，…，(d;，d)， 当 只 有 一 个 智能 体 使 
用 这 条 边 时 ， 权 重 为 0， 当 有 两 个 或 多 个 智能 体 使 用 时 ， 权 重 为 无 穷 大 。 
通过 这 样 加 点 和 边 的 方式 ， 构 建 一 个 对 称 的 通用 单元 自私 路 由 博弈 。 
定理 19.6 的 证 明 中 完成 了 一 个 从 通用 单元 自私 路 由 博弈 的 PNE 计算 到 
对 称 通用 单元 自私 路 由 博弈 的 PNE 计算 的 归 约 。 思 考 为 什么 上 面 这 种 思 
路 不 能 完成 类 似 于 定理 19. 6 的 证 明 中 的 归 约 ? 


本 问题 研究 的 是 一 个 有 着 相同 初始 节点 o 和 相同 目标 节点 d 的 单元 自私 

路 由 博弈 网 络 。 

(a) (H) 证 明 该 问题 的 PNE 可 以 在 这 个 博弈 描述 参数 规模 的 多 项 式 时 间 
内 被 计算 出 来 。 假 设 边 上 的 代价 函数 是 非 减 的 。 

(b) 〈H) 假 设 该 网 络 是 一 系列 从 o 到 da 的 并 行 边 的 集合 ， 而 并 没有 其 他 节 
点 。 证 明定 理 13.6 的 逆 定 理 : 每 一 个 均衡 流 都 将 势 函 数 (13.6) 最 
小 化 。 

Cc) 通过 实例 证 明 ， 在 有 共同 初始 节点 和 共同 目标 节点 的 通用 的 网 络 中 ， 
(b) 中 结论 不 成 立 。 
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本 章 继续 讨论 学 习 动 力学 收敛 到 均衡 的 局 限 性 以 及 多 项 式 时 间 算 法 计算 均衡 的 局 
限 性 。 本 章 将 关注 混合 策略 纳什 均衡 (Mixed Nash Equilibria，MNE)。PPAD 完全 
性 与 PLS 完全 性 类 似 ， 它 告诉 我 们 在 一 般 化 的 双人 博弈 中 混合 策略 纳什 均衡 是 计算 
困难 的 。 这 意味 着 第 18 章 中 得 到 的 针对 双人 零 和 博弈 的 好 结果 无 法 被 扩展 到 更 一 般 
化 的 博弈 中 。 

20. 1 节 给 出 在 双 和 矩阵 博弈 中 计算 混合 策略 纳什 均衡 这 一 问题 的 规范 化 定义 。 
20. 2 节 解 释 了 为 什么 NP 完全 性 不 适用 于 该 问题 的 计算 困难 性 分 析 ， 也 不 适 于 PLS 
问题 的 困难 性 分 析 。20. 3 节 给 出 了 复杂 度 集 合 PPAD 的 规范 化 定义 ， 在 这 个 集合 
下 ,计算 混合 策略 纳什 均衡 是 一 个 完全 问题 。20. 4 节 中 ,依据 Sperner 引 理 描述 了 一 
个 经 典 的 PPAD 问题 。20. 5 节 揭 示 了 为 什么 对 双 和 矩阵 博弈 计算 混合 策略 纳什 均衡 是 
一 个 PPAD 问题 。20. 6 节 讨 论 了 PPAD 完全 问题 的 分 支 。 


20.1 双 和 矩阵 博弈 的 混合 策略 纳什 均衡 的 计算 


一 个 双人 博 穿 (不 一 定 是 零 和 的 ) 就 叫 作 双 和 矩阵 博弈 。 一 个 双 和 矩阵 博 穿 可 以 描述 为 
两 个 mXn 的 收益 矩阵 4 AB. 其 中 一 个 是 行 参 与 者 的 ， 一 个 是 列 参与 者 的 。 在 零 和 
博弈 中 ，B 王 一 A。 我 们 考虑 双 和 矩阵 博弈 中 混合 策略 纳什 均衡 的 计算 ， 即 两 人 的 策略 这 
和 3 了》 了 对 于 行 参与 者 的 所 有 混合 策略 x*， 满 足以 下 公式 


STAG D> x'AP (20. 1) 
且 对 于 列 参与 者 的 所 有 混合 策略 y. WE 
"BS 二 ATBy (20. 2) 


虽然 研究 者 付出 了 巨大 的 努力 ， 但 是 对 双 和 矩阵 博弈 的 混合 策略 纳什 均衡 的 计算 ， 
尚 无 多 项 式 时 间 算 法 。 本 章 将 构建 一 个 合适 的 复杂 度 理论 ， 用 以 论证 该 问题 可 能 本 质 
上 就 是 计算 困难 的 。 我 们 的 目标 是 证 明 该 问题 是 一 个 合适 的 复杂 度 集 的 完全 问题 。 但 
是 究竟 是 哪个 复杂 度 集 呢 ? 20.2 节 将 会 揭示 为 什么 传统 的 NP 完全 性 不 适用 于 均衡 
的 计算 问题 。20. 3 节 将 给 出 具体 的 解决 方案 。 





20.2 全 NP 搜索 问题 


20.2.1 ANP 搜 索 问 题 

NP 问题 的 定义 出 自 一 个 验证 器 即 给 定 一 个 实例 情境 和 这 个 实例 情境 下 的 一 个 
可 能 的 解 ， 这 个 解 能 在 多 项 式 时间 内 被 验证 器 接受 或 拒绝 。 如 果 验 证 器 接受 了 某 个 输 
和信， 那么 就 称 该 输入 为 实例 情境 的 一 个 “证 据 *"。 传 统 上 来 讲 ，NP 问题 是 一 类 决策 
性 问题 > ， 也 就 是 说 根据 实例 情境 是 否 至 少 有 一 个 “证 据 *”， 正 确 答案 应 该 为 “是 ” 
或 “ 否 ”。 

均衡 计算 问题 不 是 决策 性 问题 ， 因 为 均衡 计算 的 输出 必须 是 一 个 非常 明确 的 均 
衡 ， 而 不 是 简单 的 “是 ”或 “ 否 ”。 为 了 解决 这 一 定义 上 的 问题 ,我们 将 使 用 复杂 度 
集合 FNP(Functional NP)。 这 是 一 类 函数 性 的 NP 问题 ,该 问题 类 似 于 NP 问题 ， 
但 是 当 答案 是 “是 ”的 时 候 ， 还 要 产 出 导致 “是 ”答案 的 一 个 证 据 。 这 类 问题 也 被 称 
为 搜索 问题 。 

一 个 FNP 的 算法 的 输入 是 一 个 NP 问题 的 实例 情境 ， 例如 逻辑 公式 或 者 一 个 无 向 
图 。 算 法 的 任务 是 ， 如 果 该 实例 情境 存在 证 据 的 话 ， 就 输出 该 实例 情境 的 一 个 证 据 ， 例 
如 ,一 个 正确 的 逻辑 公式 的 赋值 或 者 一 个 汉密尔顿 轿 。 如 果 该 实例 情境 不 存在 证 据 ， 则 
算法 应 输出 “ 否 ”。FP 是 ENP 问题 的 子 集 ，FP 问题 可 以 在 多 项 式 时 间 内 求解 。 

在 19. 2. 3 节 中 ,我 们 使 用 两 个 多 项 式 时 间 的 算法 实现 了 从 一 个 搜索 问题 L 到 另 
一 个 搜索 问题 L; 的 归 约 。 第 一 个 算法 A, 将 L 问题 的 一 个 实例 情境 xELi 映射 到 L 
问题 的 一 个 实例 情境 A (a) © Lo, 算法 An 将 实例 情境 A1(z) 的 一 个 证 据 映 射 到 实例 
情境 zx 的 一 个 证 据 ( 或 者 从 “ 否 ” 映 射 到 “ 否 ”)。” 

19. 2 节 中 的 PLS 问题 集 是 FNP 问题 的 一 个 子 集 。 局 部 最 优 解 就 是 PLS 问题 的 
一 个 证 据 ， 且 PLS 问题 描述 中 的 第 三 个 算法 是 该 证 据 的 验证 器 。 实 际 上 ，PLS 问题 
的 第 三 个 算法 所 做 的 明显 比 一 个 NP 验证 器 要 多 。 当 这 个 算法 的 输入 是 一 个 非 局 部 最 
优 解 时 ， 算 法 不 仅仅 简单 地 输出 “ 否 ”"， 而 是 给 出 另外 一 个 具有 更 好 目标 函数 值 的 解 。 

计算 双 和 矩阵 博弈 的 混合 策略 纳什 均衡 也 属于 FNP 问题。 这 个 论点 的 核心 之 处 在 
于 一 个 高 效 的 解决 方案 ， 该 方案 能 快速 地 检查 博弈 的 混合 策略 组 合 是 否 是 混合 策略 纳 
什 均衡 。 虽 然 均衡 的 条 件 (20. 1) 和 (20. 2) 涉 及 无 穷 多 个 混合 策略 ， 但 是 我 们 只 需要 检 
查 向 纯 策 略 的 偏离 (参考 练习 13. 1)， 而 这 可 以 在 多 项 式 时 间 内 完成 。 





O ”很 多 算法 类 教材 也 称 其 为 “判定 性 问题 ”。 本 书 使 用 “决策 性 问题 ”一 词 ， RAE 

© AP 问题 的 思想 适用 于 .FNP 问题 。 例 如， 可 满足 性 问题 (SAT) 的 决策 问题 版 是 .NP 完全 的 ,这 表明 
T SAT 问题 的 函数 版 是 FNP 完全 的 。 

© 严谨 地 讲 ， 我 们 也 需要 论证 存在 一 个 混合 策略 纳什 均衡 ， 它 可 以 在 多 项 式 时 间 内 被 描述 完成 。 
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20.2.2 具有 证 据 的 NP 搜索 问题 


混合 策略 纳什 均衡 的 计算 是 不 是 FNP 完全 的 呢 ? 如 果 和 所 有 ANP 问题 同样 困 
难 ， 这 将 意味 着 混合 策略 纳什 均衡 将 会 是 计算 困难 的 。 有趣 的 是 ，FNP 完全 性 给 出 
的 结果 是 很 令 人 惊讶 的 。 

定理 20. 1( 混 合 策略 纳什 均衡 的 计算 不 是 ANP 完全 的 ) ”对 于 双 答 阵 博 弈 计算 混 
合 策略 纳什 均衡 不 是 FNP 完全 的 ， 除 非 NP=coNP., 

虽然 NP=coNP 并 不 直接 意味 着 P= 二 NP， 但 研究 者 们 相信 它们 都 不 太 可 能 成 
立 。 例 如 ， 如 果 NP=coNP, 那么 不 可 满足 性 问题 (coNWP 完全 的 ) 就 具有 简洁 的 证 
明 。 证 明 一 个 命题 逮 辑 的 公式 是 可 满足 的 是 一 个 相对 简单 的 问题 ， 因 为 只 需要 给 出 一 
个 可 以 满足 该 公式 的 真 值 即 可 。 但 是 相 比 而 言 ， 证 明 一 个 公式 针对 真 值 表 中 的 所 有 行 
都 不 能 满足 ， 则 需要 指数 级 的 真 值 检 查 次 数 。 大 多 数 研究 者 相信 这 是 很 难 办 到 的 ， 即 
AP 天 coAP。 如 果 这 个 结论 是 真 的 ,那么 定理 20. 1 意味 着 计算 双 和 矩阵 博弈 的 混合 策 
略 纳什 均衡 不 是 FNP 完全 的 。 

证 明 : 假设 有 一 个 归 约 ， 类 似 于 19. 2. 3 节 中 的 PLS 的 归 约 。 这 个 归 约 将 函数 型 
SAT 问题 归 约 到 计算 双 和 矩阵 博弈 中 的 混合 策略 纳什 均衡 。 按 照 定 义 ， 这 个 归 约 应 有 
两 部 分 组 成 : 

1. 一 个 多 项 式 时 间 的 算法 4 ， 它 将 每 一 个 SAT 公式 多 映射 到 一 个 双 和 矩阵 博弈 
A; (9). 

2. 一 个 多 项 式 时 间 的 算法 4 ， 它 将 博弈 A O 的 每 一 个 混合 策略 纳什 均衡 映射 
到 SAT 公式 上 #$ 的 一 个 可 满足 性 赋值 ; 如 果 没 有 这 样 的 可 满足 性 赋值 ， 则 将 该 混合 策 
略 纳 什 均衡 映射 到 字符 串 “no”。 图 20. 1 展示 了 这 两 个 算法 。 


SAT 问 题 的 算法 


计算 MNE 的 |4(%) 的 MNE 
算法 j 


图 20.1 从 SAT PEDE REER E A R e h A E A A d AE E A 4, AP 
约 将 导致 不 可 满足 性 问题 具有 多 项 式 时 间 的 验证 器 
















SAT 问 题 的 一 个 
情境 实例 4 











我 们 的 论断 是 : 如 果 这 两 个 算法 A 和 A, 存在 ， 则 意味 着 NP=coNP. WS ilk 
明 这 个 论断 ， 考 虑 一 个 无 法 满足 的 SAT 公式 p 和 博弈 A, (8) 的 任意 一 个 混合 策略 纳 
HOGER. HIS 。 如 果 按 照 假设 ， 以 上 归 约 算法 A 和 A 存在 ， 则 这 个 均衡 应 该 能 够 





加 ”需要 强调 的 一 点 是 ， 根 据 定 理 20.5，.4 (8) 至 少 有 一 个 混合 策略 纳什 均衡 ( 见 练习 20.1), 
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快速 地 证 实 $ EAN ALA. RETA A, WERE WP=coNWP。 假 设 某 
个 均衡 (%,， 3) 能够 证 实 #$ 不 可 满足 ， 用 于 完成 以 上 证 明 的 验证 器 需要 执行 两 个 工作 : 
(1) 使 用 算法 A 来 计算 一 个 博弈 A, HWER, PERR A1($) 的 一 个 混合 策略 
纳什 均衡 ; (2) 使 用 算法 A, 来 验证 .4 (Lk. 了 ) 就 是 字符 串 “no”。 这 样 的 验证 器 的 执行 
fal ES ACL. 了) 的 多 项 式 级 的 。 如 果 这 个 假定 均衡 解 (, $3) 能够 通过 以 上 两 个 验证 
过 程 ， 就 意味 着 $ 是 不 可 满足 的 。 m 

定理 20. 1 的 证 明 实际 上 是 在 告诉 我 们 : FNP 完全 问题 和 那些 至 少 存在 一 个 证 据 
的 问题 之 间 是 不 契合 的 。 一 个 函数 型 SAT 问题 是 一 个 FNP 完全 问题 ， 这 类 问题 可 
能 不 存在 任何 证 据 ; 但 是 ， 混合 策略 纳什 均衡 的 计算 这 样 的 问题 都 含有 至 少 一 个 证 
据 。 对 于 SAT 问题 的 答案 可 能 是 “ 否 ”， 而 混合 策略 纳什 均衡 计算 的 答案 却 总 是 一 个 
确切 的 均衡 。 

具有 至 少 一 个 证 据 的 FNP 问题 子 集 叫 作 TFNP， 即 “全 函数 型 NP” 问 题 。 定 
理 20. 1 的 证 明 可 以 有 更 一 般 化 的 结论 ， 即 如 果 所 有 TFNP 都 是 FNP 完全 问题 ， 则 
NP 二 coNP。 尤 其 是 ， 因 为 每 一 个 PLS 问题 都 至 少 有 一 个 证 据 ( 局 部 搜索 总 会 在 某 一 
个 局 部 最 优 处 停 下 来 )， 所 以 PLS 问题 是 TFNP 间 题 的 子 集 。 所 以 ， 除 非 NP= 
coNP， 所 有 PLS 问题 ， 包 括 计算 拥塞 博弈 的 纯 策 略 纳什 均衡 ， 都 不 会 是 FNP HA 
问题 。 

定理 20. 2(PCS 问题 不 是 FNP 完 全 的 ) 除非 NP=coNP, HA PLS 问题 都 不 
是 FNP 完全 的 。 


20.2.3 语法 的 复杂 度 集 与 语义 的 复杂 度 集 


由 于 双 和 矩阵 博弈 的 混合 策略 纳什 均衡 的 计算 是 TANP 的 一 员 ， 这 就 排除 了 它 是 
FNP 完全 的 (除非 NP 二 coNP)。 现 在 的 目标 就 是 证 明 它 是 TANP 完全 的 ， 是 和 其 他 
任何 TFNP 问题 同样 困难 的 。 

遗憾 的 是 ，TFNP 完全 性 仍然 是 一 个 过 高 的 目标 。 这 是 因为 TFNP 好 像 并 不 含 
有 完全 性 问题 。 为 了 解释 这 一 点 ， 考 虑 一 个 具有 完全 性 问题 的 复杂 度 集 ， 例 如 NP， 
也 可 以 考虑 P 和 PSPACE。 这 些 复杂 度 集 有 什么 共性 呢 ?” 这 些 集合 的 构建 是 基于 
“语法 ”的 ， 也 就 是 说 一 个 问题 是 否 属于 这 样 的 集合 ， 可 以 被 一 个 实 实在 在 的 计算 模 
型 检验 (例如 多 项 式 时 间或 多 项 式 空间 的 确定 性 或 非 确 定性 图 灵机 )。 从 这 个 意义 上 
讲 ， 一 个 问题 是 否 属于 该 集合 ,是 有 通用 的 原因 的 。 

基于 “语法 ”定义 的 复杂 度 集 都 有 “通用 的 ”完全 性 问题 ， 其 输入 是 基于 接收 机 
的 对 该 问题 进行 的 描述 以 及 该 问题 的 一 个 实例 情境 ， 其 目标 是 为 这 个 实例 情境 给 出 
解 。 例 如 ， 通 用 的 MP 完全 问题 的 输入 是 一 个 验证 器 ， 一 个 多 项 式 时 间 上 界 ， 以 及 某 
个 实例 情境 的 编码 ， 它 的 目标 是 决定 是 否 存在 一 个 证 据 ， 这 个 证 据 使 得 验证 器 在 给 定 
的 时 间 内 能 够 接收 该 实例 情境 。 
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TFNP 并 不 具备 以 上 所 述 的 性 质 ， 即 并 没有 一 个 实 实在 在 的 计算 模型 来 检验 一 个 问 
题 是 否 属于 TFNMP。TFNP 是 基于 “语义 ”的 3 。 例 如 ， 计 算 双 和 矩阵 博弈 的 混合 策略 纳 
什 均衡 属于 TFNP 的 原因 是 该 问题 的 拓扑 性 质保 证 了 MNE 的 存在 性 (参见 20. 5 节 ) 。 
另外 一 个 TFNP 问题 是 因子 分 解 : 给 定 一 个 正 整 数 ， 输 出 它 的 因子 分 解 。 在 这 个 问 
题 下 ， 该 问题 属于 TFNP 是 基于 数论 的 原因 。 然 而 ， 博 弈 中 MNE 的 存在 性 和 整数 的 
因子 分 解 本 质 上 是 不 是 同一 个 通用 TAP 问题 的 两 种 实例 情境 ? 这 一 点 无 人 知晓 。 


20.2.4 我们 该 做 什么 


在 20.3 节 定义 了 TFNP 的 一 个 子 集 PP4D。 这 个 集合 描述 了 计算 双抢 阵 博 弈 的 
混合 策略 纳什 均衡 的 计算 复杂 度 。 图 20. 2 推测 出 PPAD 和 我 们 所 讨论 过 的 其 他 复杂 
度 集 之 间 的 关系 。PPAD 的 定义 需要 一 定 技巧 ， 而 且 看 起 来 并 不 是 很 自然 。 但 是 根 
据 下 面 的 结论 ， 这 种 定义 是 合理 的 。 


| 复杂 度 集 | 非 正规 的 定义 | 
多 项 式 时 间 可 解 的 搜索 问题 
多 项 式 时 间 可 验证 的 证 据 
一 定 存在 证 据 
通过 局 部 搜索 可 解 
通过 有 向 图 上 的 寻 路 可 解 


a) 复杂 度 集合 概要 










FNP 


TFNP 


ey 
© 


b) 复杂 度 集合 间 可 能 的 关系 
图 20.2 复杂 度 集 的 概括 。 根 据 定义 ,我 们 有 PLSUPPADCTFNPCFNP。 集 合 FP 中 的 
所 有 问题 都 可 以 被 看 作 PLS 或 PPAD 的 一 种 退化 
定理 20. 3( 计 算 混合 策略 纳什 均衡 是 PPAD 完全 的 ) 计算 双 和 矩阵 博弈 的 混合 策 
略 纳什 均衡 是 PPAD 完全 的 。 
定理 20. 3 的 证 明 很 长 而 且 很 复杂 ( 见 总 结 部 分 )。 本 章 剩 余 的 部 分 将 着 重 于 
PPAD 的 定义 和 其 背后 的 直觉 ， 我 们 还 会 解释 为 什么 计算 双 和 矩阵 博弈 的 混合 策略 纳 
什 均衡 是 PPAD 问题 。 


名 ”该 类 问题 还 有 其 他 的 一 些 有 趣 的 例子 ， 例 如 MP 站 coNFP( 见 练习 20. 2) 。 
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* 20.3 PPAD: TFN 刀 的 一 个 语法 子 集 


我 们 的 目标 是 : 通过 证 明 双 矩阵 博弈 的 MNE 的 计算 是 某 一 个 集合 C 的 完全 问 
题 ， 来 分 析 它 的 计算 困难 性 ， 这 里 C 应 该 是 FP 的 一 个 超 集 。 第 20. 2 节 中 ， 我 们 说 C 
应 该 是 TFNP 的 一 个 子 集 且 应 该 具有 完全 性 问题 。C 的 定义 应 该 是 基于 “语法 ”的 。 

我 们 已 经 知道 PLS 是 TFNP 的 一 个 子 集 ， 看 起 来 比 FP 更 大 ， 且 具备 完全 性 问 
题 ( 见 19.2 节 )。 例 如 ,最 大 荐 问题 中 计算 局 部 最 优 就 是 PLS 完全 问题 ， 而 且 并 不 知 
道 是 否 在 多 项 式 时 间 内 可 解 。PLS 问题 的 定义 是 基于 “语法 ”的 ， 因 为 每 一 个 PLS 
问题 都 是 被 三 个 算法 来 定义 的 ( 见 19. 2.2 节 )。 针 对 所 有 的 PLS 问题 ， 它 们 都 属于 
TFNP 的 共同 原因 是 ,通用 的 局 部 搜索 程序 都 是 使 用 三 个 算法 作为 “黑金 ”"， 且 能 够 
保证 最 终 能 找到 一 个 局 部 最 优 的 证 据 。 

双 和 矩阵 博弈 的 MNE 计算 的 恰当 的 复杂 度 集 是 PPAD。。 在 正式 定义 之 前 ,我 们 将 
其 类 比 为 PLS 进行 描述 ， 这 种 类 比 在 本 质 上 是 相似 的 ， 只 在 细节 上 有 区 别 。PPAD 和 计 
算 混合 策略 纳什 均衡 之 间 的 联系 并 不 是 直观 的 ， 这 一 点 我 们 将 在 20. 5 节 中 着 重 阐述 。 

我 们 可 以 把 局 部 搜索 问题 视 为 在 有 向 无 环 图 上 对 吸收 点 进行 搜索 的 问题 
(图 19. 3) 。 图 上 的 节点 对 应 于 可 行 解 ， 节 点 数目 根据 输入 的 不 同 是 指数 级 增长 的 。 
通过 在 图 上 行走 直到 吸收 点 这 样 的 操作 方式 ， 我 们 可 以 解决 每 一 个 PLS 问题 。 

和 PLS 问题 类 似 ，PPAD 问题 是 那些 可 以 使 用 通用 寻 路 方法 来 解决 的 问题 的 集 
合 。 所 有 的 PPAD 问题 都 可 以 被 视 为 一 个 有 向 图 (图 20.3) ， 图 上 的 节点 是 “ 解 ”， 边 
是 “移动 ”PLS 和 PPAD 的 本 质 区 别 在 于 : PLS 对 应 的 图 是 有 向 无 环 图 ， 而 
PPAD 对 应 的 图 是 有 向 图 ， 且 所 有 节点 上 的 出 度 不 超过 1， 人 度 也 不 超过 1。 另 外 根 


ERE 
简单 型 源 节点 ~、 


ra Da 





图 20.3 一 个 PPAD 问题 对 应 于 一 个 有 向 图 ， 图 中 节点 的 出 度 不 超过 1， 入 度 也 不 超过 1 


© PPAD 是 “polynomial parity argument, directed version” 的 缩写 ， 中 文 可 理解 为 “多 项 式 级 的 奇偶 
论证 ， 有 向 图 版 本 。 具 体 命名 缘由 可 参考 下 一 页 内 容 ， 或 参考 本 章 所 引用 的 论文 。 对 于 parity argu- 
ment， 有 些 中 文 论文 中 也 译 为 “奇偶 校 验 ”。 一 一 译 者 注 
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据 定义 ，PPAD 对 应 的 图 有 一 个 简单 型 源 节 点 ， 即 没有 任何 人 边 的 点 。 如 果 从 简单 
型 源 节 点 出 发 沿 着 出 边 遍 历 ， 就 不 会 产生 环 ， 因 为 人 度 最 多 是 1 且 简 单 型 源 节点 没有 
和 人 边 。 在 这 样 的 图 上 ， 从 源 节 点 出 发 ， 一 定 能 到 达 一 个 吸收 点 。 与 PLS 不 同 的 是 ， 
PPAD 问题 中 没有 目标 函数 ， 并 且 这 个 图 可 以 具有 环 。 根据 定义 ，PPAD 问题 的 证 
据 就 是 图 上 的 吸收 点 ,或 者 那些 非 简单 型 的 源 节点 。 

与 PLS 类 似 ，PPAD 的 定义 是 基于 “语法 ”的 ， 可 以 用 以 下 三 个 算法 来 诠释 。 





PPAD 问题 的 组 件 

L 第 一 个 多 项 式 时 间 算 法 的 输入 是 一 个 实例 情境 。 输 出 是 两 个 不 同 的 解 ， 分 别 对 
应 于 简单 型 源 节点 和 它 的 下 一 跳 节 点 。 

2. 第 二 个 多 项 式 时 间 算 法 的 输入 是 一 个 实例 情境 ， 以 及 一 个 既 不 是 简单 型 源 节点 
也 不 是 它 的 下 一 跳 节 点 的 解 工 输出 是 ， 要 么 返回 另 一 个 解 ， 即 工 的 上 一 跳 节 
点 y， 要 么 声明 “无 上 一 跳 节点 ”。 

3. 第 三 个 多 项 式 时 间 算 法 的 输入 是 一 个 实例 情境 和 一 个 不 是 简单 型 源 节点 的 解 zx。 
输出 是 ， 要 么 返回 另 一 个 解 ， 即 工 的 下 一 跳 节 点 y， 要 么 声明 “无 下 一 跳 节点 ”。 











这 三 个 算法 定义 了 一 个 有 向 图 。 图 上 的 点 对 应 着 可 能 的 解 。 当 且 仅 当 第 二 个 算法 
mia Ay 的 上 一 跳 ， 且 第 三 个 算法 中 y 为 工 的 下 一 跳 时 ， 有 向 边 (z，2) 存 在 。 第 
一 个 算法 还 定义 了 从 简单 型 源 节点 到 它 的 下 一 跳 的 有 向 边 ; 这 保证 了 简单 型 源 节点 不 
能 作为 吸收 点 出 现 。 该 图 上 的 每 一 个 节点 的 出 度 和 入 度 都 不 超过 1。 在 这 个 图 上 ， 除 
了 简单 型 源 节点 ， 所 有 那些 出 度 或 入 度 为 0 的 节点 都 是 原始 问题 的 证 据 。? 

所 有 PPAD 问题 都 至 少 有 一 个 证 据 ， 并 且 这 些 证 据 都 可 以 通过 以 上 这 种 三 步 的 
寻 路 算法 来 计算 出 来 。 这 个 流程 从 简单 型 源 节 点 出 发 ， 沿 边 的 方向 依次 遍历 ， 直 至 到 
达 一 个 吸收 点 ( 即 一 个 证 据 )3 。 从 这 个 意义 上 讲 ，PP.4D 问题 有 通用 的 描述 和 计算 模 
型 ， 它 们 是 属于 TFNP 的 。 

那么 PPAD 问题 和 混合 策略 纳什 均衡 的 计算 有 什么 关系 呢 ? 为 了 理解 PPAD 这 
个 复杂 度 集 ， 我 们 下 一 节 先 讨论 一 个 经 典 的 PPAD 的 实例 情境 。 


* 20.4 经 典 的 PPAD 问题 实例 : Sperner 引 理 


本 节 探 讨 一 个 很 明显 符合 PPAD 的 计算 问题 实例 。20. 5 节 将 更 进一步 说 明 这 个 





日 在 PPAD 问题 的 定义 中 ， 有 一 些 对 算法 错误 进行 的 简单 检查 。 例 如 ,如果 第 三 个 算法 没有 在 给 定 的 
多 项 式 阶 步骤 内 停止 ,或 者 输出 是 简单 型 源 节点 或 它 的 下 一 跳 ， 那么 算法 的 输出 就 被 标注 为 “无 下 
一 跳 节 点 ”。 

加 第 二 个 算法 的 目的 是 保证 第 三 个 算法 不 会 造假 ， 并 保证 第 三 个 算法 不 会 产生 大 于 1 的 人 度 。 





实例 与 双 和 矩阵 博弈 中 混合 策略 纳什 均衡 的 计算 的 关系 。 

考虑 在 平面 中 有 一 个 可 被 再 切 分 的 三 角形 ( 见 图 20.4)。 一 个 合法 的 点 着 色 是 上 
方 的 顶点 着 红色 ， 左 方 的 顶点 着 绿色 ， 厂 
侧 的 顶点 着 蓝 色 。 在 边界 上 的 每 一 个 点 的 
颜色 都 应 该 选取 这 条 边界 的 两 个 顶点 其 中 
之 一 的 颜色 。 三 角形 内 部 的 节点 可 以 使 用 
三 种 颜色 中 的 任意 一 种 。 如 果 在 一 个 小 的 
三 角形 中 ， 三 种 颜色 全 都 出 现 ， 就 称 这 个 
小 三 角形 是 三 色 的 。 

Sperner 引 理 断言 ， 对 每 一 种 合理 着 
色 ， 至 少 存在 一 个 三 色 三 角形 。° 

定理 20. 4(Sperner 引 理 ) ”对 于 一 个 
可 以 再 切 分 的 三 角形 ， 每 一 种 合法 着 色 
下 ， 都 有 奇数 个 三 色 三 角形 存在 。 

证 明 : 定义 一 个 图 G， 其 节点 对 应 于 每 一 个 小 三 角形 ， 外 加 一 个 源 节点 代表 大 三 
角形 外 面 的 区 域 。 如 果 两 个 小 三 角形 有 一 条 公共 边 ， 且 此 公共 边 有 一 个 红色 顶点 和 一 
个 绿色 顶点 ， 那 么 在 图 G 上 ， 这 两 个 小 三 角形 所 对 应 的 节点 间 就 有 一 条 边 。 这 样 ， 
每 一 个 三 色 的 小 三 角形 都 对 应 图 G 上 一 个 度 为 1 的 节点 。 如 果 一 个 小 三 角形 中 有 一 
个 绿色 顶点 和 两 个 红色 顶点 ,或 者 两 个 红色 顶点 和 一 个 绿色 顶点 ， 那 这 个 小 三 角形 对 
应 图 G 上 一 个 度 为 2 的 节点 。 图 G 上 源 节 点 的 度 就 是 大 三 角形 左 侧 边 上 同时 具有 红 、 
绿 两 种 节点 的 线段 的 数目 ， 而 这 个 数 是 奇数 。 根 据 握手 定理 ， 任 意 无 向 图 上 奇数 度 节 
点 的 数目 都 是 偶数 个 ， 所 以 最 终 三 色 三 角形 的 数目 是 奇数 个 。 tal 

Sperner 定理 的 证 明 告 诉 我 们 ， 在 一 个 合适 的 图 上 从 一 个 简单 型 源 节 点 出 发 的 寻 
路 问题 关联 到 三 角形 的 三 着 色 问 题 。 所 以 ， 在 可 再 切 分 的 、 合 法 着 色 的 三 角形 上 进行 
三 着 色 的 问题 是 PPAD 问题 .5 


图 20.4 平面 上 一 个 可 以 被 再 切 分 的 三 角形 


* 20.5 混合 策略 纳什 均衡 和 PPAD 


PPAD 是 FNP 中 可 以 通过 一 个 特殊 的 寻 路 过 程 进行 求解 的 那个 子 集 ， 那 么 计算 





日 ”该 结论 和 证 明 可 以 扩展 到 高 维 空间 上 。 在 RR" 中 ， 每 一 个 被 n 十 1 种 颜色 合法 着 色 的 可 再 切 分 单纯 形 
(subdivided simplex) 都 包含 奇数 个 全 色 子 单纯 形 (panchromatie subsimplices) ， 在 每 一 个 全 色 子 单纯 
形 中 ， 每 条 边 都 着 不 同色 。 

O ”我们 省 略 掉 了 一 些 细节 。PPAD 问题 的 图 是 有 向 图 ， 而 定理 20. 4 的 证 明 中 定义 的 图 G 是 无 向 图 。 但 
是 有 简单 的 方法 能 使 图 G 变 为 有 向 图 。 另 外 ，PPAD 问题 中 的 简单 型 源 节点 的 出 度 是 1， 而 图 G 中 
的 源 节点 的 度 是 24 一 1, k 是 正 整数 。 为 了 解决 这 个 间 题 ， 可 以 通过 将 G 中 的 源 节点 拆 分 成 & 个 节点 ， 
包括 一 个 出 度 为 1 的 源 节点 和 一 1 个 人 度 和 出 度 为 1 的 节点 。 
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混合 策略 纳什 均衡 与 PP4D 有 什么 关系 ? 它们 有 两 个 基本 的 联系 。 


20.5.1 Sperner 引 理 和 纳什 定理 


Sperner 引 理 (定理 20. 4) 是 纳什 定理 的 核心 。 

定理 20. 5( 纳 什 定理 ) ”任意 一 个 有 限 博 弈 都 含有 至 少 一 个 混合 策略 纳什 均衡 。 

从 纳什 定理 到 Sperner 引 理 的 归 约 有 两 步 。 第 一 步 是 使 用 Sperner 引 理 证 明 布 劳 威 
尔 不 动 点 定理 。 布 劳 威 尔 不 动 点 定理 告诉 我 们 ， 如 果 连 续 函 数 了 是 从 一 个 紧 凸 集 C BIA 
己 的 映射 (其 中 C 是 R" 的 子 集 )， 那 f 至 少 有 一 个 不 动 点 zxEC 使 得 f(a) =x, ° 

考虑 一 个 特殊 情境 ，C 是 R* 下 的 一 个 单纯 形 。 假 设 函 数 f 是 连续 的 。 像 图 20. 4 
一 样 ， 将 C 切 分 成 小 的 三 角形 。 对 于 小 三 角形 的 顶点 c WRA f(x) 比 点 zx 距离 C 
的 左 侧 极点 更 远 ， 那 么 将 顶点 2 着 绿色 ; 如 果 点 f(z) 比 点 xz 距离 C 的 上 侧 极点 更 远 ， 
那么 将 顶点 x 着 红色 ; 如 果 点 f(z) 比 点 工 距 离 C 的 右 侧 极点 更 远 ， 那 么 将 顶点 工 着 
KA; 如果 f(z) 到 两 个 极点 的 距离 都 变 远 了 ， 那 么 两 种 颜色 任 选 其 一 。( 如 果 f(x) 
到 任何 极点 的 距离 都 没有 变 远 ， 那 么 r 就 直接 是 一 个 不 动 点 ， 无须 证 明 .) 现 在 这 个 问 
题 就 转变 为 一 个 子 三 角形 上 的 合理 着 色 问 题 。 根 据 Sperner 引 理 ， 至 少 存在 一 个 三 角 
形 ， 这 个 三 角形 的 三 个 顶点 分 别 被 函数 f 搜 向 不 同 的 极点 。 考 虑 将 小 三 角形 不 断 地 再 
划分 下 去 ,我 们 就 得 到 了 更 小 的 三 角形 三 着 色 问 题 。 因 为 C 是 紧 的 ， 所 以 这 些小 三 
角形 的 中 心 将 逐渐 收敛 到 C 中 的 一 个 点 zx" 。 因 为 函数 f 是 连续 的 ， 在 极限 情况 下 ， 
f(x" ) 到 三 个 极点 的 距离 都 是 和 xz" 一 样 的 。 这 意味 着 x 是 函数 f 的 一 个 不 动 点 。® 

现在 简 述 纳什 定理 (定理 20. 5) 是 如 何 归 和 约 到 布 劳 威 尔 不 动 点 定理 的 。 考 虑 一 个 上 
个 智能 体 的 博弈 ， 策 略 空间 是 S1 oe, Sh, KARRE mo oe, mo HK ROK 
是 C=AiX…XA:， 其 中 A; 是 一 个 单纯 形 ， 表 示 S 上 的 混合 策略 。 我 们 想 定义 一 个 
连续 函数 f/:C 一 C， 它 是 从 混合 策略 组 合 到 混合 策略 组 合 的 上 映射。 函数 f 的 不 动 点 就 
是 博弈 的 混合 策略 纳什 均衡 。 我 们 对 S 的 各 个 组 件 分 别 定义 ， 有 fiC >a ~A A 
然 的 想法 就 是 使 得 f; 是 智能 体 i 应 对 其 他 智能 体 的 混合 策略 组 合 时 的 最 优 反应 。 这 
样 的 方法 不 能 产生 连续 的 ， 甚 至 不 能 产生 良好 定义 的 函数 。 我 们 使 用 规范 化 的 方案 
如 下 

f: (tis xX) = argmax g; (x; sX) (20. 3) 


x, EA; 


其 中 


O ” 当 你 搅动 一 硫 咖 罪 时 ， 匣 啡 中 至 少 有 一 个 点 位 置 不 会 变 。 

O 布 劳 威 尔 不 动 点 定理 可 以 扩展 到 R 空间 中 的 所 有 紧 凸 集 。 首 先 ， 因 为 Sperner 引 理 能 够 被 扩展 到 高 
维 空间 上 ， 使 用 同样 的 论证 方法 ， 可 知 布 劳 威 尔 不 动 点 定理 在 任意 维度 的 单纯 形 上 仍然 成 立 。 其 次 ， 
通过 射线 投影 可 知 ， 任 意 一 对 相同 维度 下 的 紧 凸 子 集 C 和 Cz 都 是 同 胚 的 ， 也 就 是 说 ， 存 在 一 个 双 
射 函 数 有 :Ci 一 Cs， 且 h 和 hh-! 为 连续 函数 。 同 胚 性 保证 了 不 动 点 定理 成 立 ( 见 练习 20. 4) 。 
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glr = E [aW] s (20. 4) 





i FSH 
ér tap 


函数 g; 的 第 一 个 项 即 是 最 优 反应 ， 第 二 项 是 一 个 惩罚 项 ， 即 不 鼓励 智能 体 ; 在 混合 
策略 上 进行 大 的 变动 。 因 为 函数 g; fer) LEM ROM, MUS 的 定义 良好 。 函 数 
fH fis os fi FERN AA 20.5)。 根 据 定 义 ， 每 一 个 MNE 都 是 f 函数 的 一 个 
不 动 点 。 反 之 ,假设 x 不 是 一 个 MNE， 即 智能 体 i 可 以 通过 偏离 策略 x 到 zx, 来 增加 
他 的 期 望 收 益 。 通 过 简单 的 计算 就 可 以 知道 ， 对 于 足够 小 的 ce 二 >0， 都 有 g (Cle) a, + 
ex!，X) 之 gi(xi;，X)， 所 以 x 不 是 了 函数 的 一 个 不 动 点 ( 见 练习 20. 6) 。 

以 上 纳什 定理 的 证 明 中 ， 我 们 将 使 用 寻 路 算法 来 计算 全 着 色 子 单纯 形 的 问题 改编 成 计 
算 有 限 博弈 中 的 混合 策略 纳什 均衡 的 问题 。 这 说 明了 MNE 的 计算 是 属于 PPAD 的 。 


20. 5.2 Lemke-Howson 算法 


还 可 以 通过 另 一 种 方式 证 明 MNE 的 计算 是 属于 PPAD 的 ， 即 使 用 Lemke-How- 
son 算法 。 对 于 该 算法 的 描述 超出 了 本 书 的 范畴 。 其 精 幕 是，Lemke-Howson 算法 将 
双 和 矩阵 博弈 的 MNE 的 计算 归 约 到 一 个 寻 路 问题 ， 就 像 单纯 形 算法 将 线性 规划 的 最 优 
解 问题 归 约 到 在 可 行 域 的 边界 上 进行 寻 路 的 问题 。Lemke-Howson 算法 和 单纯 形 算法 
最 大 的 差别 在 于 Lemke-Howson 算法 没有 使 用 目标 函数 。 已 知 的 对 于 Lemke-How- 
son 算法 收敛 性 的 证 明 都 是 使 用 类 似 Sperner 引 理 证 明 中 的 基于 奇偶 论证 的 方式 。 这 
些 收敛 性 的 证 明 告 诉 我 们 ,计算 双 和 矩阵 博弈 的 混合 策略 纳什 均衡 属于 PPAD。 


20.5.3 结语 


以 上 两 节 所 述 的 PP4D 和 MNE 的 两 种 关联 是 不 能 相互 比较 的 。Lemke-Howson 
算法 只 适用 于 双人 博弈 ， 但 是 它 讨 论 的 是 ， 对 双 和 矩阵 博弈 计算 精确 的 MNE 是 属于 
PPAD 的 。 而 Sperner 引 理 所 使 用 的 寻 路 算法 适用 于 任意 的 有 限 数量 参与 者 的 博弈 ， 
但 是 它 只 告诉 我 们 计算 近似 MNE 是 属于 PPAD 的. 

不 论 哪 种 情况 ,我 们 的 结论 都 是 : 计算 双 和 矩阵 博弈 的 混合 策略 纳什 均衡 是 
PPAD 的 。 定 理 20. 3 告诉 我 们 ，MNE 的 计算 和 其 他 任何 可 以 通过 通用 寻 路 方法 来 
求解 的 问题 同样 困难 (要 求 是 有 向 图 ， 具 有 一 个 简单 型 源 节 点 ， 且 出 度 和 入 度 最 高 为 
1) 。 这 至 少 说 明了 PPAD 是 分 析 MNE 计算 困难 性 的 合适 的 复杂 度 集 。 

例如 ， 定 理 20.3 意味 着 ， 对 有 限 的 连续 函数 计算 一 个 近似 的 不 动 点 是 一 个 
PPAD 问题 ， 可 以 归 约 到 一 个 计算 MNE 的 问题 ， 而 这 又 是 20.5.1 节 中 所 阐述 的 归 
约 的 反 向 形式 。 


O 实际 上 ， 对 于 3 个 或 者 更 多 个 参与 者 的 博弈 ,精确 混 合 策略 纳什 均衡 的 计算 似乎 是 比 PPAD 中 的 所 
有 问题 都 更 加 困难 的 ( 见 说 明 部 分 )。 
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20.6 讨论 


对 定理 20. 3 的 一 种 有 争议 性 的 诠释 是 : 纳什 均衡 的 这 种 计算 困难 使 得 我 们 不 能 
用 它 来 做 通用 型 的 行为 预测 。 如 果 没 有 博弈 MNE 的 多 项 式 时 间 的 算法 ， 那 我 们 也 就 
不 能 期 待 博弈 的 参与 者 们 能 够 快速 找到 MNE。 

计算 困难 性 并 不 是 纳什 均衡 的 首要 和 缺陷。 例如 ，MNE 的 非 唯一 性 已 经 限制 了 它 
的 预测 能 力 。 但 是 定理 20. 3 给 出 的 关于 其 计算 困难 性 的 结论 很 适合 理论 计算 机 科学 
来 跟 进 。 

如 果 我 们 不 分 析 博 弈 的 纳什 均衡 ,那么 应 该 分 析 什 么 呢 ? 定理 20. 3 告诉 我 们 ， 
可 以 关注 那些 计算 简单 的 博弈 和 均衡 概念 。 例 如 ,我 们 从 无 憾 动 力学 的 收敛 性 保障 受 
到 启发 ， 从 而 找 出 了 博弈 的 相关 均衡 或 粗糙 相关 均衡 所 满足 的 特性 ， 

那 PPAD 问题 究竟 有 多 困难 呢 ? 这 个 基本 的 问题 还 没有 被 调查 清楚 。 由 于 尚 没 
有 证 明 PPAD 问题 是 否 是 多 项 式 时 间 可 解 的 ,我 们 就 需要 将 PPADL FP 这 一 假设 与 
E PNP 更 强 的 假设 关联 起 来 。 例 如 ， 我们 是 否 可 以 将 PPAD 问题 的 计算 困难 性 建 
立 在 密码 学 的 假设 之 上 (例如 单 向 函数 的 存在 性 )? 


总 结 


e 尚 无 用 于 计算 双 和 矩阵 博弈 中 混合 策略 纳什 均衡 的 多 项 式 时 间 算 法 。 

© TFNP 是 NP 搜 索 问 题 (FNP) 中 一 定 含 有 证 据 的 那 类 子 集 ， 它 包含 了 所 有 的 
PLS 问题 和 双 和 矩阵 博弈 的 混合 策略 纳什 均衡 的 计算 问题 ，。 

所 有 TFNP 问题 都 不 是 FNP 完全 问题 ， 除 非 NP 二 coNP。 

© TFNP 问题 可 能 并 不 含有 完全 问题 。 


© PPAD 问题 是 TFNP 问题 的 一 个 子 集 ， 且 其 证 据 可 以 通过 在 一 个 有 向 图 上 进 
行 寻 路 计算 出 来 ， 这 个 有 向 图 应 该 具有 源 节点 ， 并 且 所 有 节点 的 出 度 和 人 度 
最 高 是 1 。 
o 计算 双 和 窍 阵 博弈 的 混合 策略 纳什 均衡 是 PPAD 完全 问题 。 
说 明 


TFNP 的 定义 和 定理 20.1 参考 Megiddo 和 Papadimitriou(1991) 。 定 理 20.2 来 





日 ”单间 函数 是 否 存在 仍 是 一 个 未 知 的 猜想 。 实 际 上 ， 单 向 函数 的 存在 会 实现 PANP 的 证 明 。 在 密码 学 
中 , 一般 假设 单 向 孙 数 存在 。 
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自 于 Johnson 等 (1988) 。 复 杂 度 集 PPAD 以 及 其 他 TFNP 的 “语法 ” 子 集 参 考 Pa- 
padimitriou(1994), Daskalakis 等 (2009a) 给 出 了 定理 20. 3 证 明 的 体系 ， 并 且 证 明了 
三 人 博弈 中 的 近似 MNE 计算 是 PPAD 完全 问题 。 陈 汐 和 邓 小 铁 (Chen 和 Deng 
(2009)) 证 明了 二 人 双 和 矩阵 博弈 中 纳什 均衡 的 计算 也 是 PPAD 完全 问题 。 相 关 的 综述 
参考 Roughgarden(2010b)、Papadimitriou(2007) 和 Daskalakis 等 (2009b)。 Sperner 
引 理 ( 引 理 20. 4) 来 自 于 Sperner(1928)。 我 们 对 纳什 定理 (定理 20.5) 的 证 明 沿 袭 了 
Geanakoplos(2003) 的 方法 ， 是 Nash(1951) 的 一 种 变种 。Lemke-Howson 算法 来 自 于 
Lemke 和 Howson(1964)，von Stengel(2002) 给 出 了 详细 的 解释 。Etessami 和 Yan- 
nakakis(2010) 证 明了 三 人 以 上 博弈 中 精确 MNE 的 计算 是 一 个 FLAP 完全 问题 ， 这 个 
复杂 度 集合 比 PPAD 严格 大 。Bitansky 等 (2015) 和 Rosen 等 (2016) 讨 论 了 将 PPAD 
完全 性 建立 在 密码 学 假设 之 上 。 

问题 20. 2 告诉 我 们 双 和 矩阵 博 讲 的 近似 MNE 的 计算 可 以 在 类 多 项 式 时 间 内 完成 ， 
参考 Lipton 等 (2003)S 。Rubinstein(2016) 证 明了 ， 基 于 一 些 可 信 的 假设 ， 针 对 计算 
近似 MNE， 并 不 存在 明显 快速 的 算法 。 问 题 20.3 Æ A F Brown 和 von Neumann 
(1950) 和 Gale 等 (1950)。 


练习 


练习 20. 1 (HH) 假 设 每 一 个 存在 解 的 性 线 方程 组 Cx 一 d 都 含有 至 少 一 个 解 ， 这 个 解 
的 描述 长 度 ( 比 特 位 长 度 ) 是 C 和 d 的 多 项 式 级 的 。 
证 明 每 一 个 双 和 矩阵 博弈 (4，B) 都 有 一 个 混合 策略 纳什 均衡 ， 这 个 均衡 的 
描述 长 度 是 收益 矩阵 4 和 B 的 多 项 式 级 的 。 

练习 20.2 (了 H) 考 虑 如 下 问题 : 给 定 一 个 非 确定 性 算法 A, ( 即 接收 “是 ”类 型 的 实 
例 )， 以 及 一 个 反 非 确定 性 算法 A ( 即 接收 “和 否 ”类 型 的 实例 )， 同 时 给 
定 一 个 多 项 式 时 间 界 ， 以 及 一 个 情境 实例 的 编码 ， 要 求 找到 一 个 .4 或 
Ay 其 中 一 个 能 在 所 述 时 间 内 接收 该 情境 实例 的 证 据 。 
为 什么 这 个 泛 化 的 问题 在 20. 2. 3 节 所 述 内容 的 意义 上 ， 不 是 一 个 WP 
coNP 的 完全 问题 ? 

练习 20.3 本 练习 说 明了 布 劳 威 尔 不 动 点 定理 中 的 所 有 假设 的 必要 性 。 
(a) 列举 一 个 从 一 个 紧 区 间 到 它 本 身 的 ( 非 连 续 ) 函数 f/， 且 该 函数 无 不 

动 点 。 


O ”这 个 结果 中 的 近似 性 是 指 加 法 性 近似 。 对 于 定义 14.5 和 定义 16.2 中 的 乘法 性 近似 ，Daskalakis 
(2013) 证 明了 ， 为 双 抑 阵 博弈 计算 近似 混合 策略 纳什 均衡 是 PPAD 完全 问题 ， 所 以 不 太 可 能 具有 类 
多 项 式 时 间 的 算法 。 


练习 20.4 


练习 20.5 
练习 20.6 


问题 


问题 20. 1 


问题 20. 2 
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Cb) 列举 一 个 从 两 个 紧 区 间 的 并 集 到 这 个 集合 本 身 的 连续 函数 ff. ATK eK 
数 无 不 动 点 。 

(c) 列举 一 个 从 一 个 有 界 开 区 间 到 它 本 身 的 连续 函数 f/， 且 该 函数 无 不 
动 点 。 

假设 C ALC, ÆR 的 子 集 且 是 同 胚 的 ， 也 就 是 说 存在 一 个 双 射 函数 :Cl 一 

Co, Ah MA 都 是 连续 的 。 求 证 : 如 果 每 一 个 从 C, 到 自身 的 连续 函数 

有 一 个 不 动 点 ,那么 每 一 个 从 Cs 到 自身 的 函数 也 有 一 个 不 动 点 。 

证 明 公 式 (20. 3) 和 式 (20. 4) 中 定义 的 函数 是 连续 的 。 

假设 在 混合 策略 组 合 x 中 ,智能 体 i 可 以 通过 单方 面 从 策略 xz; 偏离 到 z; 

来 增加 它 的 期 望 收益 。 证 明 gj;((1 一 e)zx; 十 ex'! ，x) 记 gi;(x;， Xx) 对 于 所 有 

足够 小 的 s>0 均 成 立 ， 其 中 g; 是 公式 (20. 4) 中 定义 的 函数 。 


CH) 假设 一 个 线性 方程 组 存在 一 个 多 项 式 时 间 的 算法 ， 该 算法 能 够 决定 该 

系统 是 否 有 解 ， 并 且 如 果 有 解 则 计算 出 一 个 解 。 使 用 这 样 的 算法 作为 计 

算 双 和 矩阵 博弈 混合 策略 纳什 均衡 的 一 个 子 程序 ， 计 算 过 程 的 时 间 复 杂 度 

ERE 2" + pad, HP p 是 某 个 多 项 式 函 数 ,， n 是 矩阵 行 和 列 之 积 。 

令 (4，B) 为 一 个 双 和 矩阵 博弈 ， 其 中 每 一 个 参与 者 最 多 有 n 个 策略 ， 且 所 

有 的 收益 都 在 L0，1] 之 间 。 一 个 e- 近 似 混 合 策略 纳什 均衡 (e-MNE) 是 混 

合 策略 的 一 个 对 (人 ,3 了 )， 并 且 对 于 所 有 的 行 混合 策略 x 有 

RTAG > x'AP—e 
且 对 于 所 有 列 混合 测 策略 y 有 
TB > x' By —e 

(a) (HAE ©€ (0, 1), Sat., OXA, BR —A MNE, 定义 K= 
(bInn)/e?, EP b>0 是 一 个 足够 大 的 常数 且 与 n 和 e HK. O(n, 
cya tts (rk，cx) 表 示 根 据 (x”，y" ) 生 成 的 KK 个 独立 同 分 布 的 博弈 
局 势 样 本 。 令 和 3 了 表示 相应 的 边缘 经 验 分 布 。 例 如 ， 分量 $; 的 定义 
Er BTN. Co. OR TAB. RUE: MRO. ca), 5 
(rx，cx) 的 比例 很 高 ， 则 (%, 是 一 个 eMNE。 

(b) (H) 给 出 一 个 计算 双 和 矩阵 博弈 的 -MNE 算法 ,要求 该 算法 的 运行 时 
间 最 多 是 2°" + p(n), 其 中 K 的 定义 和 (a) 中 一 样 。 

C) 扩展 你 的 算法 和 分 析 ， 计算 一 个 e-MNE， 要 求 在 这 个 均衡 下 的 期 望 
总 收益 要 接近 于 精确 MNE 能 实现 的 最 大 期 望 收 益 。 你 的 运行 时 间 应 
该 保持 不 变 。 
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如 果 在 一 个 双 和 矩阵 博弈 中 ， 参 与 者 的 策略 集 一 样 B=4-， 则 称 这 个 博弈 

是 对 称 的 。 对 称 博 弈 的 例子 包括 剪刀 -石头 - 布 (18. 3. 1 节 ) 和 交通 灯 博 弈 

(13.1.4 节 )。 纳 什 定 理 和 Lemke-Howson 算法 都 适用 于 对 称 博弈 ， 并 且 

表明 每 一 个 对 称 博 弈 都 有 一 个 对 称 MNE， 其 中 两 个 参与 者 使 用 相同 的 混 

合 策略 ( 即 2 一 》) 。 

Ca)〈H) 按 照 19, 2. 3 节 的 方式 给 出 一 个 归 约 ,将 一 个 通用 双 和 矩阵 博弈 中 
的 MNE 计算 问题 归 约 到 一 个 对 称 双 和 矩阵 博弈 中 的 对 称 MNE 计算 
问题 。 

(b) 给 出 一 个 归 约 ， 将 一 个 通用 双抢 阵 博弈 中 的 MNE 计算 问题 归 约 到 一 
个 对 称 双 矩阵 博弈 中 的 任意 MNE 计算 问题 。 

(c) (H) 给 出 一 个 归 约 ， 将 一 个 通用 双 和 矩阵 博弈 中 的 MNE 计算 问题 归 约 
到 一 个 对 称 双 和 矩阵 博弈 中 的 不 对 称 MNE 计算 问题 ， 或 者， 如 果 没 有 
不 对 称 MNE， 则 报告 “无 解 ”。 
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10 个 最 重要 的 知识 点 


. 二 价 单 物 品 拍卖 。 这 是 我 们 第 一 个 关于 “理想 化 ”拍卖 的 例子 ， 它 不 仅 是 占 优 策 


略 激励 相 容 (DSIC) 的 ， 社 会 福利 最 大 化 的 ， 而 且 是 计算 高 效 的 (定理 2.4)。 单 物 
品 拍卖 已 经 展示 了 在 设计 上 的 微小 改变 将 会 对 参与 者 的 行为 造成 巨大 且 复 杂 的 影 
响 ， 例 如 一 价 拍卖 和 二 价 拍卖 在 支付 规则 上 的 不 同 所 造成 的 影响 。 


. BERRIE, HTSA., Kik DSIC 机 制 可 以 归 约 为 设计 分 配 规则 (定理 


3.7)。 实 际 应 用 包括 理想 型 关键 字 搜 索 拍 卖 (3. 5 节 )， 近似 多 项 式 时 间 的 最 优 背 包 
拍卖 (定理 4.2)， 并 且 由 该 引 理 可 知 ， 在 给 定 估 值 分 布下 ， 最 大 化 期 望 收益 可 以 归 
约 为 最 大 化 期 望 虚拟 福利 (定理 5.4)。 


. Bulow-Klemperer 定理 。 在 单 物品 拍卖 中 ， 增 加 一 个 竞拍 者 和 在 已 知 估 值 分 布下 进 


行 最 优 拍 卖 效 果 一 样 好 (定理 6.5)。 这 个 结论 结合 预知 不 等 式 (定理 6. 1) ， 是 得 到 
以 下 结论 的 重要 线索 : 简单 的 先 验 独 立 拍卖 效果 可 以 和 最 优 拍卖 差不多 好 。 


.VCG 机 制 。 在 一 般 的 情境 下 ， 要 求 参 与 者 支付 他 们 产生 的 外 部 性 可 以 得 到 一 个 满 


Æ DSIC 的 最 大 化 福利 机 制 (定理 7.3)。VCG 机 制 在 许多 现实 世界 的 应 用 场景 下 不 
是 很 实用 ， 比 如 无 线 频谱 拍卖 (第 8 章 )。 这 就 激励 我 们 寻找 像 同 时 升 价 拍卖 一 样 
更 加 简单 的 非 直接 拍卖 形式 (8. 3 节 ) 。 

不 含 钱 机 制 设计 。 许 多 优美 且 应 用 广泛 的 机 制 都 是 不 使 用 金钱 的 。 例 子 包 括 首位 
交易 环 机 制 ( 定 理 9.7 和 9.8)、 肾 脏 交 换 机 制 (定理 10. 1) 以 及 盖 尔 - 沙 普 利 稳定 匹 
配 机 制 (定理 10.5、10.7 和 10.8), 


. 自私 路 由 。 最 坏 情 况 下 的 自私 路 由 总 是 很 简单 一 一 类 Pigou 示例 的 网 络 就 能 够 最 


大 化 无 秩序 代价 (POA) (定理 11.1 和 11.2)。 因 此 ， 只 有 当代 价 函 数 的 非 线性 程度 
很 高 时 ， 自 私 路 由 的 POA 才 会 很 大 。 另 外 有 确凿 的 实验 证 据 表 明 超 额 配 置 的 网 络 
可 以 使 网 络 性 能 提高 。 

鲁 棒 POA 界 。 讲 义 中 所 有 的 POA 界 证 明 都 是 参数 平滑 的 (定义 14. 2)。 正 因 如 此 ， 
它们 就 可 以 使 用 相对 宽松 和 容易 处 理 的 均衡 概念 比如 粗糙 相关 均衡 (定理 14. 4) 。 


. 势 博弈 。 在 博弈 的 很 多 种 类 中 ,包含 路 由 、 寻 址 和 网 络 代 价 分 捧 博 弈 ， 选 手 们 都 


隐 式 地 在 优化 势 函 数 的 方向 努力 。 任 意 势 博弈 都 至 少 有 一 个 纯 策 略 纳什 均衡 (定理 
13.7) 并 且 最 优 反 应 动力 学 总 能 够 收敛 (命题 16. 1)。 势 函数 在 证 明 像 POA 这 类 界 
的 时 候 也 很 有 用 (定理 15.1 和 15. 3)。 


. 无 憾 算法 。 无 憾 算 法 是 存在 的 ， 其 中 一 些 简 单 的 例子 存在 最 优 和 遗憾 界 ， 比 如 乘 性 
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权重 算法 (定理 17. 6) 。 如 果 一 个 重复 博弈 中 的 选手 采用 一 个 无 憾 或 者 无 交换 遗憾 
算法 来 选择 他 的 混合 策略 ,那么 联合 博弈 历史 的 时 间 平 均 将 会 分 别 收敛 到 一 组 粗 
糙 相 关 均 衡 ( 命 题 17. 9) 或 者 相关 均衡 (命题 18. 4) 。 这 两 个 均衡 概念 都 是 计算 简单 
的 ， 就 如 两 人 零 和 博弈 里 的 混合 策略 纳什 均衡 一 样 (定理 18.7). 

10. 均衡 计算 的 复杂 度 。 一 般 来 讲 ， 纳 什 均衡 的 计算 似乎 是 计算 困难 的 。PLS 完全 性 
(19. 2 节 ) 和 PPAD 完全 性 (20. 3 节 ) 分 别 是 在 纯 策 略 纳什 均衡 和 混合 策略 纳什 均 
衡 计 算 的 意义 上 对 NP 完全 性 进行 类 比 。 


部 分 练习 及 问题 提示 


问题 2. 1(c) : 假设 <==1/4， 使 用 前 半 部 分 的 竞拍 者 来 实现 校正 。 

问题 3. 1(b) : 从 竞拍 者 i 的 角度 思考 ， 并 瞄准 广告 位 j。 

问题 3. 1(d) : 首先 证 明 ， 在 一 个 局 部 无 嫉妒 的 报价 组 合 中 ， 必 须 按 照 单位 点 击 量 估 
值 非 递增 的 顺序 来 对 竞拍 者 进行 排序 。 

问题 3. 1(e) : 使 用 公式 (3.8) 。 什 么 样 的 报价 能 够 在 GSP 中 产生 这 些 支付 ? 使 用 (d) 
部 分 的 结论 来 证 明 这 些 报价 形成 了 一 个 纳什 均衡 。 

问题 3. 2(b): 重点 是 检查 收益 目标 拍卖 的 支付 规则 满足 迈 尔 森 的 支付 公式 。 

练习 4.7: 佳 士 得 和 苏 富 比 拍卖 是 怎么 样 的 ? 

问题 4. 2(b): WR S 是 最 优 解 (物品 的 估 值 组 合 是 v)，S 是 计算 得 到 的 解 (在 立 下 最 


， 那 么 2: sm, Ti i k = Diu —m) z 


问题 4. 2(e): BASHAM m fA. 并 用 ko 中 的 结 。 在 什么 情况 下 ， 使 用 两 个 单 
Genie RRR Aen Spe ee 

问题 4.3(a): 将 该 问题 归 约 到 图 的 最 大 独立 集 的 计算 问题 ( 见 Garey 和 Johnson 
(1979) ) 。 

问题 4. 3(c) : 当 贪 心算 法 错误 地 选择 了 某 个 竞拍 者 ， 它 可 以 阻碍 多 少 其 他 的 竞拍 者 ? 

练习 5.6: 分 布 的 期 望 是 无 穷 的 ， 违 反 了 5.1.3 节 的 假设 。 

问题 5. 2: 利用 问题 5. 1(c) 。 

问题 5. 3(c): AEP ROM. BORN: 在 wv 是 最 高 估 值 的 条 件 下 ， 次 高 估 
值 的 期 望 值 。 

练习 6. 1(b): 佑 值 分 布 服从 于 两 个 不 同 均匀 分 布 的 竞拍 者 就 可 以 满足 。 


练习 6.2: EXE Prin >r, ATAA JIPS AFAN i] RH 


两 个 对 应 策略 中 至 少 有 一 个 满足 要 求 ， 即 或 者 选择 奖励 至 少 为 上 的 策略 ， 或 者 选 
择 第 一 个 值 超 过 上 的 策略 。 

练习 6. 4: 利用 Bulow-Klemperer 定理 。 当 一 个 竞拍 者 被 移 除 时 ， 利 用 定理 5.2 来 限 
定 最 优 期 望 收益 减少 的 值 。 

问题 6. 1(a): Wn=2, 

问题 6. 2(b): 利用 向 下 封闭 来 推出 由 M "得 到 的 结果 。 

问题 6. 2(c) : 利用 (a) 部 分 。 
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问题 6. 3(b): 给 定 牌价 p,，…，p,， 考 虑 单 物品 拍卖 其 中 每 个 竞拍 者 i 的 保留 价 
为 p;， 同 时 把 物品 分 配给 剩 下 所 有 竞拍 者 中 u p 值 最 大 的 那 位 。 

问题 6. 3(c): 把 牌价 p eo pe 设 为 和 定理 6.4 证 明 过 程 中 一 样 的 牌价 ” 。 证 明 在 
以 下 形式 的 单 物品 拍卖 中 获得 的 期 望 收益 更 少 : 对 每 个 竞拍 者 分 别 设置 一 个 保留 
价 p;， 并 把 物品 分 配给 剩余 竞拍 者 (如 果 还 有 的 话 ) 中 p: 值 最 小 的 那个 。 利 用 预 
知 不 等 式 (定理 6. 1 和 备注 6. 2) 来 确定 拍卖 的 虚拟 福利 和 期 望 收益 的 下 界 。 

问题 6.4(b) : 取 定 理 6.5 中 n=l 的 例子 来 推导 ， 当 只 有 一 个 竞拍 者 和 一 个 物品 时 ， 
通过 一 个 随机 服从 于 下 的 牌价 p 获得 的 期 望 收益 至 少 是 下 下 垄断 价格 p 获得 的 
期 望 收益 的 一 半 。 利 用 相应 规律 来 证 明 ， 对 于 每 个 cS. 以 上 结论 对 价格 
max{p, ¢}#l max{ p". OARS. MARIA AJ 为 给 定 的 最 优 机 制 带 来 的 期 
望 收益 是 多 少 呢 ? 

练习 7.5: 利用 二 部 图 的 最 大 权重 匹配 可 以 在 多 项 式 时 间 内 完成 。 

问题 7. 1(b): 将 VCG 支付 ( 式 (7. 2)) 加 和 并 化 简 ， 得 到 式 (7. 4) 左 边 的 积分 ， 且 积分 
与 竞价 无 关 。 

问题 7. 3(b): 利用 次 可 加 性 。 

问题 7. 3(c) : 利用 问题 7.2。 练 习 7.5 也 与 之 相关 。 

练习 8. 1: 首先 计算 最 大 化 所 有 竞拍 者 的 效益 之 和 ， 然 而 删除 掉 里 面 有 关 价格 的 项 。 

练习 8. 2: 使 用 与 披露 问题 一 样 的 示例 即 可 。 

问题 8. 3: 对 于 熟悉 线性 规划 对 偶 理 论 的 读者 而 言 ， 一 个 分 配对 应 于 一 个 二 部 图 的 最 
大 权重 匹配 ， 而 价格 对 应 于 一 组 最 优 对 偶 解 ， 均 衡 条 件 对 应 于 互补 松弛 条 件 。 相 
应 地 ， 使 用 VCG 机 制 的 支付 来 定义 物品 的 价格 ， 并 用 最 优 匹配 的 结构 来 验证 均 
MRF. 

练习 9. 3: 构造 一 个 案例 使 得 其 中 某 个 竞拍 者 可 以 延迟 地 报告 需求 缩减 从 而 使 得 另外 
某 个 竞拍 者 支付 得 更 多 ， 如 此 的 话 ， 对 于 未 来 的 物品 就 会 导致 较 低 的 价格 。 

练习 9.4(c): 考虑 一 个 现实 场景 ， 其 中 每 个 B;/wi 都 相对 较 大 但 仍然 远 小 于 mm。 

问题 9. 1(b) : 首先 证 明 对 于 任意 一 个 这 样 的 确定 性 DSIC 拍卖 ， 存 在 一 个 简单 的 在 估 
值 集 上 的 分 布 使 得 拍卖 的 期 望 社会 福利 最 多 为 期 望 最 高 估 值 的 c/n 信 。 解 释 为 什 
么 这 就 是 确定 性 以 及 随机 性 拍卖 所 期 望 的 下 界 。 

问题 9. 3(c) : 通过 两 种 不 同 的 方式 泛 化 (b) 中 的 机 制 。 一 种 不 太 明 显 的 方式 是 用 一 些 
额外 的 “虚拟 峰值 ”增补 到 上 报 的 峰值 集合 里 。 

练习 10. 1: 把 集合 E/F, 里 的 一 条 边 加 回来 ,使 其 要 么 对 在 i 被 匹配 之 前 的 顶点 没有 
影响 ,要么 确保 i 一 定 会 被 匹配 。 

练习 10. 6: 如 果 医 院 w 偏好 于 和 (申请 人 最 优 的 稳定 匹配 ) 而 不 是 v' 进 行 匹配 (其 他 


O TER: 作为 一 个 非 单 参 数 场景 ， 你 不 能 假设 期 望 收益 等 于 期 望 虚 拟 福 利 ( 比 照 定理 5. 2) 。 
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稳定 匹配 M')， 那 么 (vw，w) 构 成 了 M' 里 的 一 个 阻塞 对 。 

问题 10. 1: 首先 考虑 一 个 这 样 的 虚报 ， 其 与 真实 的 偏好 列表 只 在 两 个 挨 着 的 医院 上 
不 同 。 然 后 通过 归纳 法 扩展 到 任意 虚报 情形 下 。 

练习 11. 1: 证 明 在 类 Pigou 网 络 中 限定 a 二 r= 二 1 不 失 一 般 性 。 在 这 样 的 网 络 中 ， 
POA MÆ b 而 减 小 。 

练习 11. 2: 可 以 直接 计算 ， 也 可 以 转 而 通过 证 明 如 何 用 仿 射 代价 函数 代替 网 络 的 目 
代价 函数 使 得 POA 只 能 减 小 。 

练习 11. 3(c): 将 代价 函数 为 多 项 式 函 数 的 网 络 变 成 一 个 POA 相同 但 代价 函数 是 单 
项 式 的 网 络 。 

练习 11. 4(a) : 从 一 个 类 Pigou 网 络 的 例子 开始 ， 用 许多 平行 的 边 ( 代 价 函 数 c 满足 
c (0) =p ) 来 模拟 代价 函数 为 常数 函数 Cr) =p 的 边 。 

练习 11.4(b): S CRR C 中 代价 函数 的 非 负 标量 积 集合 。 将 Ca) 的 结论 应 用 到 C 并 
用 多 条 边 的 路 径 来 模拟 标量 积 。 

问题 11. 2(b) : 布雷 斯 悖 论 。 

问题 11. 2(c): 这 其 实 是 定理 11. 2 和 练习 11. 1 一 个 相对 比较 直接 的 结论 。 

问题 11. 3(b): 向 一 个 有 6 个 项 点 的 网 络 加 两 条 边 。 

练习 12.2(c): 仿照 定理 11. 2 的 证 明 。 在 式 (11. 10) 中 ， 利 用 wp 代替 w(C) 再 加 上 有 超 
量 的 假设 来 完成 证 明 。 

练习 12. 6: 检查 所 有 y Me 都 很 小 的 例子 。 当 y 或 者 变 大 时 会 发 生 什么 ? 

问题 12. 1: 证 明 ， 当 代价 函数 为 仿 射 函 数 时 ， 即 使 右边 再 多 出 1/4， 不 等 式 (12.4) 依 
然 成 立 。 


问题 12. 3(a) : 两 个 有 用 的 最 小 可 能 工期 的 下 界 是 maxau M D) w/m . 


练习 13. 4: 按照 边 来 进行 证 明 。 

问题 13. 1: MAA E RE i BRR =m Fl wS 的 特殊 情况 。 使 用 著名 的 占用 问题 
(例如 balls into bins) 的 相关 性 质 (这 些 性 质 可 以 在 Mitzenmacher 和 Upfal(2005) 
以 及 Motwani 和 Raghavan(1996) 找 到 ) 。 

问题 13. 3: 对 于 必要 性 ， 可 以 令 CI ，…，C 等 于 势 函数 。 

问题 13. 4(a): 资源 下 对 应 团队 博弈 的 局 势 。 将 团队 博弈 中 智能 体 i 的 每 个 策略 s: 映 
射 到 中 i 选择;; 的 局 势 子 集 。 除 了 被 所 有 智能 体 使 用 的 资源 ， 其 他 资源 的 代价 
都 为 0。 

问题 13. 4(b) : 资源 对 应 智能 体 i 和 其 他 智能 体 的 策略 s-,。 将 虚 博 弈 中 智能 体 ; 的 
策略 s: 映射 到 由 s-; 或 当 i 使 用 除 ;; 之 外 的 策略 时 的 s_;。 除 了 被 每 个 智能 体 都 使 
用 的 资源 ， 其 他 所 有 资源 的 代价 都 是 0。( 这 样 的 代价 函数 可 能 是 递减 的 ， 这 在 
拥塞 博弈 中 是 允许 的 。) 
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练习 14.1: 利用 性 质 (P2) 。 

练习 14.5: 按照 14.4.1 节 的 推导 过 程 。 

问题 14. 1(c) : 证 明 每 个 这 样 的 博弈 关于 (b) 中 的 最 优 局 势 是 (2， 0)- 平 滑 的 ( 见 备注 
14.3), 

问题 14. 2(b) : 证 明 每 个 这 样 的 博弈 关于 所 有 竞拍 者 的 竞价 为 其 估 值 一 半 时 的 最 优 局 
势 是 (元 ，1 )- 平 滑 的 。 

问题 14. 3(a) : 考虑 两 个 竞拍 者 和 两 个 物品 的 情况 ,其 中 v Sva, v Sval. 

问题 14. 3(b) : 固定 每 个 竞拍 者 ;都 至 少 得 到 一 个 物品 ji 时 的 最 优 局 势 。 证 明 每 个 
这 样 的 博弈 关于 每 个 竞拍 者 i 对 物品 j( 引 竞价 wm ， 且 对 其 他 物品 竞价 0 时 的 最 
优 局 势 都 是 (1，1)- 平 滑 的 。 

练习 15.6: 证 明 式 (15. 4) 的 一 个 更 强 的 版 本 。 

问题 15. 3: 一 般 化 练习 13. 4 并 且 仿 照 定理 15. 1 的 证 明 。 

练习 16. 1: 两 个 拥有 三 个 策略 的 智能 体 就 足以 说 明 情 况 。 

练习 16. 4: 创建 一 个 如 图 16. 1 的 有 向 图 并 且 把 图 中 节点 进行 拓扑 排序 。 

问题 16. 2: 重新 证 明 引 理 16. 5， 这 次 同样 使 用 此 点 : 智能 体 ; 而 不 是 /7 被 选中 并 且 智 
REIRE j 有 偏 移 到 s, 的 选项 。 

问题 16. 3(b): 三 个 智能 体 足 以 说 明 情况 。 

问题 16. 3(c) : 从 智能 体 数 目的 角度 归纳 证 明 。 添 加 新 智能 体 到 归纳 定义 的 PNE 之 
后 ,说 明 最 优 反 应 动力 学 在 最 多 轮 后 收敛 到 一 个 PNE。 

练习 17. 1: 把 此 问题 归 约 到 代价 在 [一 1，1] 里 的 特例 。 

练习 17. 2: 在 每 次 到 达 一 个 2 次 震 的 时 间 点 上 时 ， 以 一 个 新 的 对 工 的 猜测 重新 启动 
算法 。 

练习 17. 3: 使 用 式 (16. 11) 的 时 间 平 均 版 本 。 

问题 17. 2(a) : 对 于 上 界 ， 遵 循 潜在 剩余 先知 的 大 多 数 人 的 意见 (多 数 票 规则 ) 。 

问题 17. 2(c) : 从 潜在 剩余 的 先知 里 ， 随 机 选择 一 个 专家 并 遵循 其 建议 。 

问题 17.3: 把 c 预先 设置 在 算法 A!，…，Ai 里 。 为 了 确保 每 个 A 都 是 无 憾 算 法 ， 
当 某 个 智能 体 j 不 使 用 算法 A 时 ， 把 其 算法 转换 为 乘 性 权重 算法 。 

问题 17. 4(a) : 当 有 需要 的 时 候 ， 通 过 掷 硬 币 逐 步 抽样 出 X,， 一 旦 具有 最 小 扰动 累 
积 代价 的 行动 a” 被 识别 出 时 ， 停 止 抽样 。 只 有 当 Xe 没有 被 完全 确定 时 才 重 新 
进行 求 和 计算 。 如 果 接 下 来 的 硬币 为 “背面 朝 上 ”， 你 能 得 到 些 什么 ? 

问题 17. 4(b) : 首先 考虑 一 个 特例 ， 其 中 对 于 任意 a，X, 一 0。 迭代 地 把 一 个 总 是 选 
择 事后 最 优 行动 的 序列 转化 为 一 个 推荐 的 算法 得 出 的 行动 序列 。 从 时 间 工 往 前 
推导 , 证 明代 价 随 着 每 一 次 的 这 种 转化 而 减低 。 

问题 17. 4(d) : 使 用 Ca) 来 证 明 ， 在 每 一 步 里 ， 除 了 使 用 概率 7 外 ，FTPL 算法 选择 与 
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(b) 中 的 算法 相同 的 行动 。 
问题 17. 4(e): 在 每 一 时 间 点 上 ,使 用 新 的 扰动 。 
练习 18. 1: 从 石头 -剪刀 - 布 里 获取 灵感 。 
练习 18. 4: 使 用 练习 18. 3。 
练习 18.6: 给 定 任意 两 人 博弈 ， 添 加 一 个 “虚拟 选手 ”使 得 此 博弈 变 为 零 和 。 
问题 18. 1: 两 个 有 两 个 策略 的 智能 体 足 以 说 明 情 况 。 
问题 18. 3(a) : 对 某 个 智能 体 i 和 策略 s' € S;， 每 个 不 等 式 都 有 如 下 形式 Xz 


SEE O 


Cts) Z i e Ci(s; sS) « 


问题 18. 4: 使 用 练习 18. 3 并 刻画 最 小 最 大 化 对 。 为 了 计算 行 选手 的 一 个 策略 ， 求 解 
一 个 混合 策略 x 以 及 最 大 的 实数 5: 对 任意 列 选手 有 可 能 采取 的 纯 ( 相 应 也 是 混 
合 的 ) 策 略 ， 行 选手 的 期 望 收益 在 采取 策略 x 时 至 少 为 5。 

练习 19. 2: 不 。 描 述 一 个 上 个 智能 体 、m 条 边 的 拥塞 博弈 只 需要 km 个 参数 ， 但 是 问 
题 (18.3) 中 的 线性 规划 是 & 的 指数 级 的 。 

练习 19. 3: 使 用 定理 19.4 证 明 中 的 归 约 。 

问题 19. 1(a): 将 计算 势 函 数 ( 式 (13.6)) 的 全 局 最 小 化 问题 归 约 到 最 小 费用 流 问 题 
( 见 Cook 等 (1998) ) 。 

问题 19. 1(b) : 直接 处 理 ， 或 者 使 用 最 小 费用 流 ， 它 是 以 在 残留 图 中 的 改善 环 不 存在 
这 一 事实 为 特点 的 。 

练习 20. 1: 考虑 (4，B) 的 某 个 混合 策略 纳什 均衡 ， 并 且 假 设 行 参与 者 ( 列 参 与 者 ) 只 
在 第 尺 行 (第 C 列 ) 中 为 正 的 概率 。 求 解 一 个 线性 等 式 系 统 ， 得 到 一 个 混合 策略 
纳什 均衡 的 概率 ， 其 中 ， 行 ( 列 ) 参 与 者 只 在 RCC) 上 进行 随机 。 

练习 20.2: 如 果 只 有 A 和 A, 的 描述 ， 你 如 何 确定 总 存在 这 样 的 证 据 ? 如 果 不 存 在 ， 
你 又 如 何 解决 NPNcoNP 中 的 问题 ? 

问题 20. 1: 使 用 练习 20. 1 中 的 解决 方法 。 

问题 20. 2(a): 使 用 Chernoff-Hoeffding 界 来 证 明 每 一 个 纯 策 略 的 期 望 收益 在 (x*， 
y ACR. F) RIL RE. X F Chernoff-Hoeffding 界 ， 参 见 Mitzenmacher 和 
Upfal(2005)， 以 及 Motwani 和 Raghavan(1996 ) 。 

问题 20.2(b) : 使 用 问题 20. 1 中 的 解法 。 和 了 中 有 和 多少 分 量 是 非 0 的 ? 

问题 20. 3(a) : 给 定 一 个 双 和 矩阵 博弈 (4，B)， 令 博弈 并 行进 行 两 次 ， 使 用 支付 矩阵 


0 A 
| 。 | 和 它 的 转 置 矩阵 
B 0 
问题 20. 3(c): 证明 (a) 中 生成 的 对 称 博弈 含有 非 对 称 MNE, 
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A 
斯 坦 福 算 法 博弈 论 二 十 讲 


Twenty Lectures on Algorithmic Came Theory 





计算 机 科学 与 经 济 学 的 交互 产生 了 “算法 博弈 论 ” 这 一 新 的 研究 领域 。 对 于 计算 机 科学 中 的 诸多 核心 问题 ， 
其 本 质 上 都 涉及 多 个 自私 个 体 之 间 的 交互 ， 经 济 学 和 博弈 论 为 这 样 的 问题 提供 了 丰富 的 推理 模型 和 定义 系统 。 而 
对 于 传统 经 济 学 中 的 问题 ， 计 算 机 科学 也 起 到 了 补充 作用 ， 例 如 关于 计算 复杂 性 、 近 似 边界 以 及 贝 叶 斯 或 平均 情 
况 分析 的 研究 。 


本 书 源 于 斯 坦 福 大 学 “算法 博弈 论 ” 课 程 讲 义 ， 通 过 具有 代表 性 的 模型 和 结论 ， 帮 助 读者 快速 了 解 这 一 领域 
的 重要 概念 。 书 中 首先 讨论 关于 规则 制定 的 理论 ， 即 “机 制 设计 ”， 包 括 在 线 广告 、 无 线 频谱 拍卖 和 肾脏 交换 等 
实例 ， 目 标 是 设计 一 个 由 多 个 策略 型 参与 者 组 成 的 系统 ， 并 保证 其 具有 良好 的 性 能 。 接 下 来 介绍 “无 秩序 代价 ” 
理论 ， 围 绕 实际 博弈 中 均衡 的 近似 保证 展开 讨论 ， 目 标 是 了 解 在 什么 情况 下 自私 的 行为 是 良性 的 。 最 后 介绍 关于 
均衡 计算 的 一 些 结论 ， 基 于 分 布 式 学 习 算法 和 以 计算 效率 为 核心 的 算法 对 均衡 进行 分 析 和 计算 ， 目 标 是 研究 如 何 
使 策略 型 参与 者 达到 博弈 均衡 ， 以 及 达到 均衡 后 的 情形 。 
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